Американская OpenAI на два дня опередила китайского конкурента Baidu в ИИ-гонках. Google не заставил себя ждать с ответом. Что может и умеет GPT-4
«Она может сдать адвокатский экзамен и получить пять баллов в нескольких выпускных школьных экзаменах», – написал 14 марта в Twitter СЕО компании OpenAI Сэм Альтман. Все эти комплименты адресованы новому детищу его компании – языковой модели GPT-4. Слухи о ее релизе распространялись уже больше недели, и ожидалось, что четвертое поколение нейросети презентуют 16 марта.
Однако OpenAI раскрыла карты на два дня раньше и опередила китайского интернет-гиганта Baidu, который вот-вот должен полноценно включиться в мировые ИИ-гонки. «Она креативнее предыдущих моделей, она значительно меньше глючит и менее предвзятая», – расхваливает GPT-4 Альтман. Чем она особенная, кроме гипотетических академических успехов?
Ожидание и реальность GPT-4
Новая модель в 10 раз больше своей предшественницы GPT-3. Четвертая версия имеет 10 трлн параметров, что позволяет решать более сложные задачи. Пример с презентации – скачать весь налоговый кодекс США и рассчитать налоги для американской семейной пары.
Вторая и более ожидаемая фишка – мультимодальность. Еще до релиза зарубежные обозреватели предполагали, что новинка сможет работать с видео, аудио и визуальными ответами. Эти ожидания оправдались не до конца.
Модель GPT-3.5, на которой построен знаменитый ChatGPT, воспринимает только текст. В GPT-4 можно загрузить изображение, однако ответ пока будет все равно текстовый. Президент и кофаундер OpenAI Грег Брокман во время онлайн-презентации нарисовал на бумаге схему простого веб-сайта, сфотографировал рисунок и отправил задачу ИИ. Алгоритм сгенерировал HTML-код для этого сайта.
GPT-4 может одновременно работать на нескольких языках. Промпт – задачу для алгоритма – можно скачать на английском, а ответы получить на украинском, испанском или другом языке.
Протестовать новинку могут пользователи платной версии ChatGPT Plus, которая стоит $20 в месяц, и поискового бота Bing Chat от главного инвестора OpenAI Microsoft. Новую модель следует ожидать в продуктах других партнеров разработчика – на платформе обработки электронных платежей Stripe и языковом сервисе Duolingo.
В ближайшее время OpenAI обещает открыть API GPT-4 для разработчиков и планирует монетизировать эту опцию. Предварительные расценки – $0,03 за 1000 токенов, или около 750 слов запроса и $0,06 за аналогичный объем ответа от модели.
Чем отвечают другие участники ИИ-гонки
Соперничество бигтеха и ниши искусственного интеллекта и генеративных языковых моделей напоминает лучшие годы технологического противостояния Apple и Samsung. Только участников гораздо больше. На один день с презентацией OpenAI был намечен выход чат-бота Ernie Bot. Этого конкурента ChatGPT создала компания-обладательница крупнейшего китайского поисковика Baidu. Бот должен стать частью поисковой системы, а затем будет доступен пользователям.
Над китайским ответом ChatGPT в круглосуточном режиме работали сотни людей, пишет WSJ. Baidu заявила, что уже имеет подписанные бизнес-контракты на использование Ernie Bot из более чем 400 компаний. Но к началу марта некоторые разработчики продукта и обозреватели WSJ сомневались, что он полностью готов к релизу.
Впрочем, в начале февраля Google тоже презентовала собственный ИИ Bard на основе модели LaMDA в не слишком совершенном виде. И похоже, что поисковый гигант всеми силами пытается наверстать разрыв в начатых детищем Альтмана ИИ-гонках.
Почти одновременно с GPT-4 Google объявил, что включит ИИ-инструменты в свои традиционные продукты – Gmail, Google Docs, облачный сервис Cloud. Параллельно компания запустила еще два инструмента для разработчиков PaLM API и MakerSuite. Первый позволяет экспериментировать с генеративными моделями компании, второй – создавать программы на базе искусственного интеллекта.
На участие в гонке претендует и Марк Цукерберг с презентованной в конце февраля языковой моделью LLaMA от Meta. Официально она предназначена для исследователей искусственного интеллекта. Однако параллельно материнская компания Facebook тестирует генеративные текстовые модели для мессенджеров WhatsApp и Messenger.
Каким будет следующий ход OpenAI? «Мы сами продолжаем экспериментировать с программами, привлекаем к этому партнеров и все еще не завершили этот эксперимент», – сказал Брокман во время презентации GPT-4.
Вы нашли ошибку или неточность?
Оставьте отзыв для редакции. Мы учтем ваши замечания как можно скорее.