Категория: Инновации
Дата: 17 июля 2023 19:15

Google против OpenAI. Что умеют чат-боты Bard и Claude 2 по сравнению с ChatGPT, который теряет пользователей и скорость. Тест-драйв Forbes

Анастасия Несенюк

Forbes

5 хв читання

Shutterstock/Коллаж Александра Карасева

ChatGPT поднял волну ИИ-хайпа, но недолго пробыл один. Только в июле в Украине и всей Европе стал доступен спешно запущенный Bard, в США и Британии – чат-бот Claude 2. На что они способны?

В середине июля 2023-го чат-бот с искусственным интеллектом Bard от техногиганта Google наконец-то «заговорил» на украинском – сервис открылся для Европы. Несколькими днями ранее своего «убийцу ChatGPT» – сервис Claude 2 – представил американский единорог Anthropic.

Официально Украины в списке Anthropic нет – тестирование открыто для США и Великобритании. Однако репортеру Forbes без проблем удалось зарегистрировать учетную запись и поработать с Claude 2 из Киева через VPN.

Популярне

Категория: Лидерство
Дата: 09 декабря

Покорители мира. Forbes Ukraine впервые собрал список украинцев, которые занимают топовые менеджерские должности за рубежом. Кто они и как им это удалось?

Откуда взялись Bard и Claude 2 и при чем здесь Google

Bard – попытка догнать OpenAI, которая стоила материнской компании Google Alphabet $100 млрд капитализации. Именно столько компания потеряла из-за неудачной презентации экспериментальной модели в феврале 2023-го.

Доработанную версию Bard открыли для ранних пользователей уже весной – сначала в США и Великобритании, в мае – еще в 180 странах, за исключением Европы. Из-за проволочек вокруг GDPR и конфиденциальности европейцам сервис открылся лишь в июле.

След Google есть и в Claude 2, который создали бывшие сотрудники OpenAI Дарио и Даниэлла Амодей. В конце 2022 года компания инвестировала в Anthropic около $300 млн в обмен на 10% акций, свидетельствует отчет Financial Times. В общей сложности основанный в 2021-м ИИ-стартап собрал $1,5 млрд инвестиций, по данным Crunchbace. В последнем раунде инвестиций Anthropic оценили в $4,1 млрд.

Тайминг можно считать идеальным – середина лета для первопроходца ChatGPT и его материнской компании OpenAI оказалась нелегкой. Посещаемость сервиса упала впервые после триумфального запуска – трафик в июне снизился на 9,7%, свидетельствуют данные Similarweb. Активность в США просела еще больше – на 10,3%.

Одно из объяснений – летние каникулы, цитирует инженера и исследователя искусственного интеллекта в Google Франсуа Шолле Fortune. Американские школьники используют ChatGPT для выполнения домашних заданий, а на отдыхе предпочитают Minecraft или другие развлечения.

В то же время пользователи в Twitter и на тематических форумах начали массово жаловаться, что ChatGPT стал более «тупым» и «ленивым». Самые частые жалобы – ответы генерируются дольше, а их качество заметно хуже, чем несколько месяцев назад. Официальных объяснений «лености» нет. Однако она может быть последствием перестройки внутри системы, пишет Business Insider со ссылкой на собеседников в индустрии.

Что могут ближайшие конкуренты ChatGPT? Forbes выбрал несколько задач, которые украинские предприниматели чаще всего делегируют языковым моделям, и сравнил результаты.

Спойлер: с точностью фактов у всех трех чат-ботов до сих пор серьезные проблемы.

Машинный перевод – в списке задач, которые генеративный ИИ выполняет на уровне, подчас даже лучше известных сервисов онлайн-перевода. Для теста ChatGPT, Bard и Claude 2 получили несколько предложений из новости CNBC о запуске ИИ-стартапа xAI от миллиардера Илона Маска и задачу перевести его с английского на украинский.

Точность перевода достаточно высока. Однако Claude 2 сделал текст более литературным, конкуренты же выдали машинные варианты.

Бонус от Bard – в дополнение к переводу бот без дополнительных промптов добавил краткий перевод текста. Минус – фактологические ошибки. Bard написал, что xAI «работала над проектами, включая AlphaCode от DeepMind и чат-боты GPT-3.5 и GPT-4 от OpenAI». Однако в реальности в этих компаниях работали отдельные члены команды xAI – Игорь Бабушкин, Кайл Косич, Кристиан Сегеди и Цзыхан Дай – прежде чем присоединиться к Маску.

Объяснить сложное понятие простыми словами – в топе промптов для генеративного ИИ. На просьбу объяснить, что такое стейкинг, ChatGPT выдал кратчайший и наименее структурированный ответ. Объяснения от Claude 2 и Bard полнее, однако чат-бот от Google ответил с грамматическими ошибками, не склоняя само слово «стейкинг».

Подводить итоги рабочих звонков и брейнштормов – наименее любимая задача команды Let`s Enhance, рассказывала Forbes соучредительница стартапа София Швец. Поэтому ее она делегирует ИИ – транскрипцию разговоров делает ассистент Otter.ai, резюме – ChatGPT.

Bard, Claude 2 и ChatGPT получили англоязычный текст более чем на 1500 слов об обновлении Windows 1. Задача – выбрать из него главное и перевести на украинский язык. Качество ответов примерно на одном уровне, объемы – разные. Bard ограничился четырьмя пунктами, Claude 2 выдал вдвое больше тезисов. Ответ бота от OpenAI – самый пространный, к нескольким тезисам ИИ добавил объяснение.

Точнее всего с задачей проанализировать финансовую отчетность Microsoft за 2022 год по ссылке справился Claude 2. Бот от Anthropic выдал краткий ответ с цифрами, не фантазируя о причинах финрезультатов. ChatGPT отказался брать данные для анализа на сайте Microsoft, написав обширную инструкцию, как обработать их самостоятельно. Bard ответил с ошибками, указав, что в 2022 году Microsoft получила $168 млрд дохода. Однако это выручка предыдущего года.

«Bard лучше отвечает на фактические вопросы, тогда как ChatGPT лучше генерирует творческий контент, такой как стихи, код, сценарии, музыкальные произведения, электронные письма, письма и т.д.», – отвечает сам Bard на запрос о том, чем отличается от первого конкурента. Однако и к творческому контенту, и к фактажу немало вопросов.

На промпт «написать стихотворение об известных украинских предпринимателях» все боты выдали нерифмованные тексты. Claude 2 упомянул Игоря Коломойского, Рината Ахметова и Виктора Пинчука, Bard обошелся без имен. ChatGPT сочинил «стихотворение» об основателях Rozetka, Grammarly и GitLab, однако полностью выдумал их имена.

Во все три сервиса вшиты базовые этические блоки. Модели отказываются отвечать на вопросы вроде «Как сделать взрывчатку?», «Как совершить суицид?» или «Где бесплатно посмотреть кино?». ChatGPT на последний запрос выдал список легальных стримингов.

Дипломатически размытые ответы ИИ дает и на провокационные вопросы о том, чей Крым или Северный Кипр.

Материалы по теме