• Сб. Янв 28th, 2023

Когда дело доходит до хороших языковых моделей, вы должны создавать или покупать?

Когда дело доходит до хороших языковых моделей, вы должны создавать или покупать?

Прошлым летом Кен Просто его описывают как «лето ИИ», особенно с большими языковыми моделями, которые делают взрывной выход. Мы видели огромные нейронные сети, обученные на массивных массивах данных, которые могут выполнять очень впечатляющие задачи, не более известные, чем OpenAI GPT-3 и его более новое, раскрученное потомство, ChatGPT.

Компании всех форм и размеров из разных отраслей спешат выяснить, как внедрить и извлечь выгоду из новой технологии. Но бизнес-модель OpenAI претерпела не меньше изменений, чем ее вклад в обработку естественного языка. В отличие от почти всех предыдущих выпусков флагманской модели, этот не поставляется с предварительно обученными весами с открытым исходным кодом, то есть группы машинного обучения не могут просто загрузить модели и настроить их для своих собственных вариантов использования.

Вместо этого они должны либо платить за то, чтобы использовать их как есть, либо платить за точную настройку моделей, а затем платить за их использование в четыре раза больше, чем за их использование. Конечно, компании по-прежнему могут выбирать другие равноправные модели с открытым исходным кодом.

Это подняло извечный корпоративный, но совершенно новый для машинного обучения вопрос: что лучше купить или создать эту технологию?

Важно отметить, что на этот вопрос нет универсального ответа; Я не пытаюсь дать исчерпывающий ответ. Я имею в виду выделить плюсы и минусы обоих путей и предложить структуру, которая могла бы помочь компаниям оценить, что им подходит, а также предоставить некоторые промежуточные пути, которые пытаются включить компоненты обоих миров.

ЧИТАТЬ   Почему «экологически чистое» водородное топливо может загрязнять атмосферу сильнее, чем газ или уголь

Покупка: быстро, но с явными подводными камнями

Хотя строительство выглядит привлекательным в долгосрочной перспективе, оно требует лидерства с сильным аппетитом к риску, а также солидной казны, чтобы поддержать этот аппетит.

Начнем с покупки. Существует множество поставщиков моделей как услуг, которые предлагают пользовательские модели в качестве API, взимая плату за каждый запрос. Этот подход является быстрым, надежным и практически не требует предварительных капитальных затрат. По сути, этот подход снижает риски проектов машинного обучения, особенно для компаний, выходящих на поле, и требует ограниченного внутреннего опыта, помимо инженеров-программистов.

Проекты можно запускать, не требуя опытного персонала по машинному обучению, а результаты модели могут быть достаточно предсказуемыми, поскольку компонент машинного обучения приобретается с набором гарантий на выходе.

К сожалению, этот подход сопряжен с очень очевидными ловушками, основной из которых является ограниченная защита продукта. Если вы покупаете модель, которую любой может купить и интегрировать в ваши системы, не будет слишком надуманным предположить, что ваши конкуренты смогут достичь паритета продуктов так же быстро и надежно. Это будет правдой, если вы не сможете создать восходящий ров с помощью невоспроизводимых методов сбора данных или нижний ров с помощью интеграций.

Более того, для решений с высокой пропускной способностью этот подход может оказаться очень дорогим в плане масштабирования. Для сравнения: DaVinci от OpenAI стоит 0,02 доллара за тысячу токенов. При консервативном предположении, что 250 токенов за запрос и ответы аналогичного размера, вы платите 0,01 доллара США за запрос. За продукт со 100 000 запросов в день вы будете платить более 300 000 долларов в год. Конечно, приложения с большим объемом текста (пытающиеся создать статью или участвовать в беседе) приведут к еще более высоким затратам.

ЧИТАТЬ   4 вопроса, которые следует задать при оценке прототипов ИИ на предмет предвзятости

Вы также должны учитывать ограниченную гибкость этого подхода: вы либо используете модели как есть, либо платите значительно больше за их тонкую настройку. Стоит помнить, что последний подход будет включать в себя негласный период «блокировки» с провайдером, потому что точно настроенные модели будут храниться на их цифровом хранении, а не на вашем.

Строительство: гибкое и надежное, но дорогое и рискованное

С другой стороны, создание собственной технологии позволяет обойти некоторые из этих проблем.

Source