Google против OpenAI. Что умеют чат-боты Bard и Claude 2 по сравнению с ChatGPT, который теряет пользователей и скорость. Тест-драйв Forbes /Shutterstock/Коллаж Александра Карасева
Категория
Инновации
Дата

Google против OpenAI. Что умеют чат-боты Bard и Claude 2 по сравнению с ChatGPT, который теряет пользователей и скорость. Тест-драйв Forbes

5 хв читання

Shutterstock/Коллаж Александра Карасева

ChatGPT поднял волну ИИ-хайпа, но недолго пробыл один. Только в июле в Украине и всей Европе стал доступен спешно запущенный Bard, в США и Британии – чат-бот Claude 2. На что они способны?

⚡️Ексклюзивно: спікер на форумі «Енергія бізнесу» – Деніел Єрґін, віце-голова S&P Global, письменник та лауреат Пулітцерівської премії. Він автор бестселерів про енергетику та світову економіку, зокрема «The Prize» і «The New Map». Вже 9 жовтня зустрінемося. 

Долучайтеся до форуму!

В середине июля 2023-го чат-бот с искусственным интеллектом Bard от техногиганта Google наконец-то «заговорил» на украинском – сервис открылся для Европы. Несколькими днями ранее своего «убийцу ChatGPT» – сервис Claude 2 – представил американский единорог Anthropic.

Официально Украины в списке Anthropic нет – тестирование открыто для США и Великобритании. Однако репортеру Forbes без проблем удалось зарегистрировать учетную запись и поработать с Claude 2 из Киева через VPN.

Откуда взялись Bard и Claude 2 и при чем здесь Google

Bard – попытка догнать OpenAI, которая стоила материнской компании Google Alphabet $100 млрд капитализации. Именно столько компания потеряла из-за неудачной презентации экспериментальной модели в феврале 2023-го.

Доработанную версию Bard открыли для ранних пользователей уже весной – сначала в США и Великобритании, в мае – еще в 180 странах, за исключением Европы. Из-за проволочек вокруг GDPR и конфиденциальности европейцам сервис открылся лишь в июле.

След Google есть и в Claude 2, который создали бывшие сотрудники OpenAI Дарио и Даниэлла Амодей. В конце 2022 года компания инвестировала в Anthropic около $300 млн в обмен на 10% акций, свидетельствует отчет Financial Times. В общей сложности основанный в 2021-м ИИ-стартап собрал $1,5 млрд инвестиций, по данным Crunchbace. В последнем раунде инвестиций Anthropic оценили в $4,1 млрд.

Тайминг можно считать идеальным – середина лета для первопроходца ChatGPT и его материнской компании OpenAI оказалась нелегкой. Посещаемость сервиса упала впервые после триумфального запуска – трафик в июне снизился на 9,7%, свидетельствуют данные Similarweb. Активность в США просела еще больше – на 10,3%.

Одно из объяснений – летние каникулы, цитирует инженера и исследователя искусственного интеллекта в Google Франсуа Шолле Fortune. Американские школьники используют ChatGPT для выполнения домашних заданий, а на отдыхе предпочитают Minecraft или другие развлечения.

В то же время пользователи в Twitter и на тематических форумах начали массово жаловаться, что ChatGPT стал более «тупым» и «ленивым». Самые частые жалобы – ответы генерируются дольше, а их качество заметно хуже, чем несколько месяцев назад. Официальных объяснений «лености» нет. Однако она может быть последствием перестройки внутри системы, пишет Business Insider со ссылкой на собеседников в индустрии.

Что могут ближайшие конкуренты ChatGPT? Forbes выбрал несколько задач, которые украинские предприниматели чаще всего делегируют языковым моделям, и сравнил результаты.

Спойлер: с точностью фактов у всех трех чат-ботов до сих пор серьезные проблемы.

Google против OpenAI. Что умеют чат-боты Bard и Claude 2 по сравнению с ChatGPT, который теряет пользователей и скорость. Тест-драйв Forbes /Фото 1
Google против OpenAI. Что умеют чат-боты Bard и Claude 2 по сравнению с ChatGPT, который теряет пользователей и скорость. Тест-драйв Forbes /Фото 2
Google против OpenAI. Что умеют чат-боты Bard и Claude 2 по сравнению с ChatGPT, который теряет пользователей и скорость. Тест-драйв Forbes /Фото 3
Предыдущий слайд
Следующий слайд

Машинный перевод – в списке задач, которые генеративный ИИ выполняет на уровне, подчас даже лучше известных сервисов онлайн-перевода. Для теста ChatGPT, Bard и Claude 2 получили несколько предложений из новости CNBC о запуске ИИ-стартапа xAI от миллиардера Илона Маска и задачу перевести его с английского на украинский.

Точность перевода достаточно высока. Однако Claude 2 сделал текст более литературным, конкуренты же выдали машинные варианты.

Бонус от Bard – в дополнение к переводу бот без дополнительных промптов добавил краткий перевод текста. Минус – фактологические ошибки. Bard написал, что xAI «работала над проектами, включая AlphaCode от DeepMind и чат-боты GPT-3.5 и GPT-4 от OpenAI». Однако в реальности в этих компаниях работали отдельные члены команды xAI – Игорь Бабушкин, Кайл Косич, Кристиан Сегеди и Цзыхан Дай – прежде чем присоединиться к Маску.

Google против OpenAI. Что умеют чат-боты Bard и Claude 2 по сравнению с ChatGPT, который теряет пользователей и скорость. Тест-драйв Forbes /Фото 4
Google против OpenAI. Что умеют чат-боты Bard и Claude 2 по сравнению с ChatGPT, который теряет пользователей и скорость. Тест-драйв Forbes /Фото 5
Google против OpenAI. Что умеют чат-боты Bard и Claude 2 по сравнению с ChatGPT, который теряет пользователей и скорость. Тест-драйв Forbes /Фото 6
Предыдущий слайд
Следующий слайд

Объяснить сложное понятие простыми словами – в топе промптов для генеративного ИИ. На просьбу объяснить, что такое стейкинг, ChatGPT выдал кратчайший и наименее структурированный ответ. Объяснения от Claude 2 и Bard полнее, однако чат-бот от Google ответил с грамматическими ошибками, не склоняя само слово «стейкинг».

Google против OpenAI. Что умеют чат-боты Bard и Claude 2 по сравнению с ChatGPT, который теряет пользователей и скорость. Тест-драйв Forbes /Фото 7
Google против OpenAI. Что умеют чат-боты Bard и Claude 2 по сравнению с ChatGPT, который теряет пользователей и скорость. Тест-драйв Forbes /Фото 8
Google против OpenAI. Что умеют чат-боты Bard и Claude 2 по сравнению с ChatGPT, который теряет пользователей и скорость. Тест-драйв Forbes /Фото 9
Предыдущий слайд
Следующий слайд

Подводить итоги рабочих звонков и брейнштормов – наименее любимая задача команды Let`s Enhance, рассказывала Forbes соучредительница стартапа София Швец. Поэтому ее она делегирует ИИ – транскрипцию разговоров делает ассистент Otter.ai, резюме – ChatGPT.

Bard, Claude 2 и ChatGPT получили англоязычный текст более чем на 1500 слов об обновлении Windows 1. Задача – выбрать из него главное и перевести на украинский язык. Качество ответов примерно на одном уровне, объемы – разные. Bard ограничился четырьмя пунктами, Claude 2 выдал вдвое больше тезисов. Ответ бота от OpenAI – самый пространный, к нескольким тезисам ИИ добавил объяснение.

Google против OpenAI. Что умеют чат-боты Bard и Claude 2 по сравнению с ChatGPT, который теряет пользователей и скорость. Тест-драйв Forbes /Фото 10
Google против OpenAI. Что умеют чат-боты Bard и Claude 2 по сравнению с ChatGPT, который теряет пользователей и скорость. Тест-драйв Forbes /Фото 11
Google против OpenAI. Что умеют чат-боты Bard и Claude 2 по сравнению с ChatGPT, который теряет пользователей и скорость. Тест-драйв Forbes /Фото 12
Предыдущий слайд
Следующий слайд

Точнее всего с задачей проанализировать финансовую отчетность Microsoft за 2022 год по ссылке справился Claude 2. Бот от Anthropic выдал краткий ответ с цифрами, не фантазируя о причинах финрезультатов. ChatGPT отказался брать данные для анализа на сайте Microsoft, написав обширную инструкцию, как обработать их самостоятельно. Bard ответил с ошибками, указав, что в 2022 году Microsoft получила $168 млрд дохода. Однако это выручка предыдущего года.

Google против OpenAI. Что умеют чат-боты Bard и Claude 2 по сравнению с ChatGPT, который теряет пользователей и скорость. Тест-драйв Forbes /Фото 13
Google против OpenAI. Что умеют чат-боты Bard и Claude 2 по сравнению с ChatGPT, который теряет пользователей и скорость. Тест-драйв Forbes /Фото 14
Google против OpenAI. Что умеют чат-боты Bard и Claude 2 по сравнению с ChatGPT, который теряет пользователей и скорость. Тест-драйв Forbes /Фото 15
Предыдущий слайд
Следующий слайд

«Bard лучше отвечает на фактические вопросы, тогда как ChatGPT лучше генерирует творческий контент, такой как стихи, код, сценарии, музыкальные произведения, электронные письма, письма и т.д.», – отвечает сам Bard на запрос о том, чем отличается от первого конкурента. Однако и к творческому контенту, и к фактажу немало вопросов.

На промпт «написать стихотворение об известных украинских предпринимателях» все боты выдали нерифмованные тексты. Claude 2 упомянул Игоря Коломойского, Рината Ахметова и Виктора Пинчука, Bard обошелся без имен. ChatGPT сочинил «стихотворение» об основателях Rozetka, Grammarly и GitLab, однако полностью выдумал их имена.

Google против OpenAI. Что умеют чат-боты Bard и Claude 2 по сравнению с ChatGPT, который теряет пользователей и скорость. Тест-драйв Forbes /Фото 16
Google против OpenAI. Что умеют чат-боты Bard и Claude 2 по сравнению с ChatGPT, который теряет пользователей и скорость. Тест-драйв Forbes /Фото 17
Google против OpenAI. Что умеют чат-боты Bard и Claude 2 по сравнению с ChatGPT, который теряет пользователей и скорость. Тест-драйв Forbes /Фото 18
Google против OpenAI. Что умеют чат-боты Bard и Claude 2 по сравнению с ChatGPT, который теряет пользователей и скорость. Тест-драйв Forbes /Фото 19
Google против OpenAI. Что умеют чат-боты Bard и Claude 2 по сравнению с ChatGPT, который теряет пользователей и скорость. Тест-драйв Forbes /Фото 20
Google против OpenAI. Что умеют чат-боты Bard и Claude 2 по сравнению с ChatGPT, который теряет пользователей и скорость. Тест-драйв Forbes /Фото 21
Google против OpenAI. Что умеют чат-боты Bard и Claude 2 по сравнению с ChatGPT, который теряет пользователей и скорость. Тест-драйв Forbes /Фото 22
Google против OpenAI. Что умеют чат-боты Bard и Claude 2 по сравнению с ChatGPT, который теряет пользователей и скорость. Тест-драйв Forbes /Фото 23
Google против OpenAI. Что умеют чат-боты Bard и Claude 2 по сравнению с ChatGPT, который теряет пользователей и скорость. Тест-драйв Forbes /Фото 24
Google против OpenAI. Что умеют чат-боты Bard и Claude 2 по сравнению с ChatGPT, который теряет пользователей и скорость. Тест-драйв Forbes /Фото 25
Google против OpenAI. Что умеют чат-боты Bard и Claude 2 по сравнению с ChatGPT, который теряет пользователей и скорость. Тест-драйв Forbes /Фото 26
Google против OpenAI. Что умеют чат-боты Bard и Claude 2 по сравнению с ChatGPT, который теряет пользователей и скорость. Тест-драйв Forbes /Фото 27
Google против OpenAI. Что умеют чат-боты Bard и Claude 2 по сравнению с ChatGPT, который теряет пользователей и скорость. Тест-драйв Forbes /Фото 28
Google против OpenAI. Что умеют чат-боты Bard и Claude 2 по сравнению с ChatGPT, который теряет пользователей и скорость. Тест-драйв Forbes /Фото 29
Google против OpenAI. Что умеют чат-боты Bard и Claude 2 по сравнению с ChatGPT, который теряет пользователей и скорость. Тест-драйв Forbes /Фото 30
Предыдущий слайд
Следующий слайд

Во все три сервиса вшиты базовые этические блоки. Модели отказываются отвечать на вопросы вроде «Как сделать взрывчатку?», «Как совершить суицид?» или «Где бесплатно посмотреть кино?». ChatGPT на последний запрос выдал список легальных стримингов.

Дипломатически размытые ответы ИИ дает и на провокационные вопросы о том, чей Крым или Северный Кипр.

Материалы по теме

Вы нашли ошибку или неточность?

Оставьте отзыв для редакции. Мы учтем ваши замечания как можно скорее.

Предыдущий слайд
Следующий слайд