Прошлым летом Кен Просто его описывают как «лето ИИ», особенно с большими языковыми моделями, которые делают взрывной выход. Мы видели огромные нейронные сети, обученные на массивных массивах данных, которые могут выполнять очень впечатляющие задачи, не более известные, чем OpenAI GPT-3 и его более новое, раскрученное потомство, ChatGPT.
Компании всех форм и размеров из разных отраслей спешат выяснить, как внедрить и извлечь выгоду из новой технологии. Но бизнес-модель OpenAI претерпела не меньше изменений, чем ее вклад в обработку естественного языка. В отличие от почти всех предыдущих выпусков флагманской модели, этот не поставляется с предварительно обученными весами с открытым исходным кодом, то есть группы машинного обучения не могут просто загрузить модели и настроить их для своих собственных вариантов использования.
Вместо этого они должны либо платить за то, чтобы использовать их как есть, либо платить за точную настройку моделей, а затем платить за их использование в четыре раза больше, чем за их использование. Конечно, компании по-прежнему могут выбирать другие равноправные модели с открытым исходным кодом.
Это подняло извечный корпоративный, но совершенно новый для машинного обучения вопрос: что лучше купить или создать эту технологию?
Важно отметить, что на этот вопрос нет универсального ответа; Я не пытаюсь дать исчерпывающий ответ. Я имею в виду выделить плюсы и минусы обоих путей и предложить структуру, которая могла бы помочь компаниям оценить, что им подходит, а также предоставить некоторые промежуточные пути, которые пытаются включить компоненты обоих миров.
Покупка: быстро, но с явными подводными камнями
Хотя строительство выглядит привлекательным в долгосрочной перспективе, оно требует лидерства с сильным аппетитом к риску, а также солидной казны, чтобы поддержать этот аппетит.
Начнем с покупки. Существует множество поставщиков моделей как услуг, которые предлагают пользовательские модели в качестве API, взимая плату за каждый запрос. Этот подход является быстрым, надежным и практически не требует предварительных капитальных затрат. По сути, этот подход снижает риски проектов машинного обучения, особенно для компаний, выходящих на поле, и требует ограниченного внутреннего опыта, помимо инженеров-программистов.
Проекты можно запускать, не требуя опытного персонала по машинному обучению, а результаты модели могут быть достаточно предсказуемыми, поскольку компонент машинного обучения приобретается с набором гарантий на выходе.
К сожалению, этот подход сопряжен с очень очевидными ловушками, основной из которых является ограниченная защита продукта. Если вы покупаете модель, которую любой может купить и интегрировать в ваши системы, не будет слишком надуманным предположить, что ваши конкуренты смогут достичь паритета продуктов так же быстро и надежно. Это будет правдой, если вы не сможете создать восходящий ров с помощью невоспроизводимых методов сбора данных или нижний ров с помощью интеграций.
Более того, для решений с высокой пропускной способностью этот подход может оказаться очень дорогим в плане масштабирования. Для сравнения: DaVinci от OpenAI стоит 0,02 доллара за тысячу токенов. При консервативном предположении, что 250 токенов за запрос и ответы аналогичного размера, вы платите 0,01 доллара США за запрос. За продукт со 100 000 запросов в день вы будете платить более 300 000 долларов в год. Конечно, приложения с большим объемом текста (пытающиеся создать статью или участвовать в беседе) приведут к еще более высоким затратам.
Вы также должны учитывать ограниченную гибкость этого подхода: вы либо используете модели как есть, либо платите значительно больше за их тонкую настройку. Стоит помнить, что последний подход будет включать в себя негласный период «блокировки» с провайдером, потому что точно настроенные модели будут храниться на их цифровом хранении, а не на вашем.
Строительство: гибкое и надежное, но дорогое и рискованное
С другой стороны, создание собственной технологии позволяет обойти некоторые из этих проблем.