Содержание
антропный недавно выпустила новую версию своей языковой модели искусственного интеллекта — Claude 3.5 Sonnet. Компания утверждает, что может генерировать более человеческий текст и более качественный код, чем другие модели, такие как ChatGPT 4o от OpenAI и Gemini 1.5 Pro от Google. Давайте углубимся в Claude 3.5 Sonnet и посмотрим, как он работает в реальных условиях.
Что такое сонет Клода 3.5
Подобно ChatGPT OpenAI, модель искусственного интеллекта Anthropic называется Claude. Однако Anthropic предлагает три варианта Claude, каждый из которых подходит для разных целей:
- Клод Опус : Самая способная модель. Эта модель превосходно справляется со сложными письменными задачами, но работает относительно медленнее.
- Клод Хайку : Самая быстрая модель. Он оптимизирован для живого взаимодействия с клиентами и перевода, но ему не хватает возможностей для выполнения сложных задач.
- Клод Сонет : баланс скорости и интеллекта. Он быстрее, чем Opus, но не так эффективен.
На данный момент выпущена только версия Claude 3.5 Sonnet. Вы можете ожидать, что версии Opus и Haiku 3.5 появятся позднее в этом году. На данный момент вы можете получить доступ к Claude 3.5 Sonnet бесплатно, но существует дневной лимит сообщений, который может варьироваться в зависимости от длины сообщения и спроса. В среднем вы можете отправить около 30 сообщений. Вы можете увеличить лимит, подписавшись на профессиональную версию, стоимость которой составляет 20 долларов США в месяц.
Давайте рассмотрим основные моменты модели сонета Клода 3.5
1. Отличные результаты в тестах: Claude 3.5 Sonnet превосходит любую другую модель в тестах, будь то математические решения, кодирование, рассуждения или визуальное понимание. Это, в частности, демонстрирует значительное улучшение рассуждений на уровне выпускников. Согласно Отчет об индексе искусственного интеллекта за 2024 год , эксперты в конкретной области набирают около 65 %, а обычные люди — около 34 %. Таким образом, Клод приближается к среднему эксперту в предметной области с показателем 59,4%.
2. Генерирует текст, похожий на человеческий: Anthropic утверждает, что эта новая модель покажет заметные улучшения. в понимании нюансов, юмора и сложных инструкций, а также отлично умеет писать высококачественный контент с естественным, понятным тоном.
3. Хорошо программирует: По данным внутреннего тестирования Anthropic, сонет Claude 3.5 идеально выполнил 64 % задач по кодированию по сравнению с Claude 3.0 Opus, который выполнил только 38 %. Это также занял первое место в таблице лидеров Aider.
4. Артефакты, новая функция: при создании контента, такого как фрагменты кода или текстовые документы, сбоку появляется окно для сгенерированного кода или контента. Вы можете редактировать сгенерированный код или текст непосредственно в Claude и работать вместе с ИИ. Если это HTML или JavaScript, вы можете запустить код и увидеть сгенерированный результат прямо на веб-сайте.
5. Теперь Клод работает быстрее: Claude 3.5 Sonnet работает в два раза быстрее, чем Claude 3 Opus. Самым большим недостатком Claude до сих пор была его скорость, которая теперь находится на уровне ChatGPT или даже быстрее. Anthropic утверждает, что реагирует со скоростью около 80 токенов в секунду, но официальных данных для сравнения с другими моделями нет.
Сравнение Claude 3.5 Sonnet с ChatGPT 4o
Принимая во внимание эти моменты, я протестировал различные примеры с Claude 3.5 Sonnet, сосредоточив внимание на его человеческих текстовых возможностях и кодировании. Я также сравнил результаты с ChatGPT 4o. Вот как это работает:
1. Творческое письмо
Я предоставил подробную подсказку, предлагающую обеим моделям создать историю.
Write a captivating story about a father lion teaching his young son the skills and wisdom needed to become the king of the forest. Explore their bond, the challenges they face, and the lessons learned along the way as the young lion grows into a wise and courageous leader.
После прочтения обеих историй победитель стал очевиден: Сонет Клода 3.5. История, созданная ChatGPT, была длиннее, но ей не хватало эмоциональной глубины.
Напротив, история Клода 3.5 Сонета обладала эмоциональной глубиной и хорошим развитием персонажей, что делало ее более убедительной. Кроме того, функция «Артефакты» позволила мне отредактировать историю и попросить Клода улучшить отдельные части, что сделало ее лучшим инструментом для написания историй в целом.
Я писал стихи, диалоги и истории других жанров. Результаты были схожими, хотя это может быть субъективно. Поскольку услуга бесплатная, рекомендую попробовать.
2. Другие тексты, такие как электронные письма, статьи и обзоры
Аналогичным образом я создавал другие типы текстов, такие как электронные письма, резюме, статьи и сценарии YouTube. Хотя шаблоны электронной почты ChatGPT были лучше, резюме Клода были намного четче и их легче сканировать. Например, вот краткое содержание этой статьи, созданной ChatGPT:
А вот резюме от Клода:
В целом оба проделали одинаковую работу по созданию профессиональных текстов и статей.
3. Разговорные навыки
Чтобы проверить навыки общения, я попробовал дать эту подсказку Клоду и ChatGPT:
I am feeling bit low today. Can you cheer me up?
И результаты гораздо более тонкие. ChatGPT имеет функцию памяти для запоминания деталей и предпочтений. Он вспомнил, что мне нравятся комедии, и начал с рекомендации хороших комедийных фильмов и других альтернатив.
В то время как Клод более чутко говорит и лучше понимает ваши запросы.
Хотя они оба снова хорошо поработали в общении, у них есть свой собственный стиль. Но если мне придется просто поговорить об их разговорных способностях, Клод одержит легкую победу.
4. Задачи по написанию кода
В Сонете Claude 3.5 также улучшено кодирование. Поэтому я попробовал несколько упражнений с каждым из них. Вот один из них.
Create an HTML and CSS Code for a responsive navigation bar.
Но ChatGPT и Клод также использовали JavaScript, хотя я об этом не упоминал. За исключением того, что код, сгенерированный обоими, находится на одном уровне друг с другом, а выходные данные были сгенерированы без каких-либо ошибок.
Однако одним заметным преимуществом Claude является то, что он поддерживает функцию «Артефакты», которая позволяет просматривать выходные данные непосредственно в Claude. Кроме того, я мог отредактировать код или попросить Клода улучшить определенные аспекты.
5. Описания изображений
Я предоставил обеим службам несколько фотографий и попросил их объяснить. Я ожидал, что Клод поймет юмор в мемах лучше, чем ChatGPT, но результаты оказались почти одинаковыми. Например, вот ChatGPT, объясняющий мем:
Это ответ Клода на то же изображение:
Лучше ли Claude 3.5 Sonnet, чем ChatGPT 4o
У них обоих свой стиль. Хотя я предпочитаю профессиональные тексты ChatGPT, Клод превосходит его, когда дело доходит до создания историй и ведения бесед. Поскольку оба сервиса бесплатны, то лучше использовать каждый по ситуации. Однако не используйте ни один из сервисов для поиска фактов, поскольку оба могут вызвать галлюцинации и предоставить неверную информацию.