DeepSeek V3: бесплатный чат-бот с открытым исходным кодом и искусственным интеллектом может превзойти ChatGPT и Gemini

Содержание

Что, если я скажу вам, что существует новый чат-бот с искусственным интеллектом, который превосходит почти все модели в сфере искусственного интеллекта, а также является бесплатным и имеет открытый исходный код? Да, DeepSeek V3 именно такой. В рейтинге Таблица лидеров Aider LLM DeepSeek V3 в настоящее время находится на втором месте, свергнув GPT-4o, Клод 3.5 Сонет и даже недавно анонсированный Gemini 2.0. Он занимает второе место после o1 модель рассуждения , для получения результата которого требуются минуты.

Итак, пришло ли наконец время перейти на модель искусственного интеллекта с открытым исходным кодом? Должны ли мы остановить наших Близнецов и Подписки на ЧатGPT ? В этой статье мы рассмотрим мой опыт работы с DeepSeek V3 и посмотрим, насколько хорошо он сочетается с лучшими игроками.

DeepSeek V3

Разработанный китайской фирмой по искусственному интеллекту ДипСик , DeepSeek V3 использует архитектуру на основе трансформатора. В частности, в нем используется преобразователь «Смесь экспертов» (MoE), где разные части модели специализируются на разных задачах, что делает модель высокоэффективной. DeepSeek делает все свои модели ИИ открытым исходным кодом, а DeepSeek V3 – первая модель ИИ с открытым исходным кодом, которая превзошла даже модели с закрытым исходным кодом в своих тестах, особенно в аспектах кода и математических расчетов.

Единственным недостатком модели на данный момент является то, что она не является мультимодальной моделью ИИ и может работать только с текстовыми вводами и выводами. Мультимодальный чат-бот с искусственным интеллектом может работать с данными в различных форматах, таких как текст, изображения, аудио и даже видео. Хотя на веб-сайте доступна возможность загрузки изображений, она позволяет извлекать только текст из изображений. Вот характеристики DeepSeek V3, которые вам нужно знать:

Функция	DeepSeek V3
Архитектура	Трансформатор со смесью экспертов (МО)
Всего параметров	671 Миллиард, но Только активация активирует 37 миллиардов параметров для каждого токена, чтобы поддерживать эффективность модели.
Обучающие жетоны	14,8 триллионов
Контекстное окно	128 000 токенов
Лимит вывода	8,000 токенов
Скорость	60 токенов в секунду
Открытый исходный код	Да

Большинство компаний, занимающихся искусственным интеллектом, не раскрывают эти данные для защиты своих интересов, поскольку они являются коммерческими моделями. Однако DeepSeek V3 вполне соответствует предполагаемым характеристикам других моделей. Самое приятное то, что DeepSeek обучил свою модель V3 всего за 5,5 миллионов долларов по сравнению с инвестициями OpenAI в 100 миллионов долларов (упоминается Сэмом Альтманом) . Итак, давайте сравним DeepSeek с другими моделями в реальном использовании.

DeepSeek V3, ChatGPT и Gemini: сравнение моделей искусственного интеллекта

Я сравнил модель DeepSeek V3 с GPT 4o и моделью Gemini 1.5 Pro ( Gemini 2.0 все еще находится в стадии бета-тестирования ) с различными подсказками. Все модели очень продвинуты и могут легко создавать хорошие текстовые шаблоны, такие как электронные письма, или получать информацию из Интернета и отображать ее, например, так, как вы хотите. В этом тесте мы попытались сравнить их способности к рассуждению и пониманию.

1. Я начал с этой подсказки:

You have 2 hourglasses—one measures 7 minutes and the other measures 11 minutes.
Question: How can you use them to measure 15 minutes exactly?

Удивительно, но и ChatGPT, и DeepSeek дали неверный ответ. В то время как DeepSeek в заключение говорит, что просто переверните 7 песочных часов два раза и отсчитайте еще 1 минуту, ChatGPT запутался и затем пришел к выводу, что вы можете измерить 15 минут с помощью приведенной выше логики

Только Gemini смогла ответить на этот вопрос, хотя мы используем старую модель Gemini 1.5.

Победитель: Близнецы

2. Затем я задал еще один логический вопрос:

Replace each letter with a unique digit (0–9) in the equation below:
SEND + MORE = MONEY
Question: What is the solution?

Эту проблему решить сложнее, чем кажется. Однако Gemini и ChatGPT напрямую дали правильный ответ. Тогда как DeepSeek дал ответ в 200 строк с подробным объяснением.

Но когда я попросил объяснений, и ChatGPT, и Gemini объяснили это максимум в 10-20 строках. В конце концов, все модели ответили на вопрос, но DeepSeek объяснил весь процесс шаг за шагом так, чтобы его было легче понять. Однако если вы предпочитаете просто просмотреть процесс, Gemini и ChatGPT помогут вам быстрее.

Победитель: DeepSeek

3. Наконец, я попросил всех моделей составить блок-схему:

Create a flowchart that outlines the process of diagnosing and fixing a Wi-Fi connection issue. The flowchart should start with checking whether the device is connected to the router and end with either a 'Connection Fixed' or 'Contact ISP' outcome. Include decision points such as verifying physical connections, restarting the router, checking IP configuration, and testing with another device.

Это несправедливое сравнение, поскольку DeepSeek на данный момент может работать только с текстом. Создание блок-схемы с изображениями и документами невозможно. Хотя результат трудно понять, логика верна.

Только ChatGPT смог создать идеальную блок-схему по запросу.

Gemini просто извлекла из Интернета изображение блок-схемы, на которой показано, как создавать блок-схемы вместо устранения неполадок Wi-Fi. Затем он начал давать мне письменные шаги вместо блок-схемы. Но когда я снова запросил блок-схему, она создала текстовую блок-схему, поскольку Gemini не может работать с изображениями в текущей стабильной модели.

Победитель: ChatGPT

Также читайте:

DeepSeek V3, ChatGPT и Gemini

Похоже, что DeepSeek находится на одном уровне с другими ведущими моделями ИИ по логическим возможностям. Компания также утверждает, что решает проблему со стогом сена, а это означает, что если вы дали большую подсказку, модель ИИ не забудет некоторые промежуточные детали. Говорят, что обязательно учтет все детали.

Обратите внимание, что это начальные стадии, и размер выборки слишком мал. Мы продолжим тестирование и изучение этой новой модели ИИ для получения дополнительных результатов и будем держать вас в курсе. Оставайтесь с нами, чтобы узнать больше.

DeepSeek V3

DeepSeek V3, ChatGPT и Gemini: сравнение моделей искусственного интеллекта

DeepSeek V3, ChatGPT и Gemini

Honkai Star Rail Лучшая сборка Herta: световые конусы, реликвии и командные компы

OnePlus Watch 3 позаимствует новые функции здравоохранения у Apple Watch

Возможно вам будет интересно