Содержание
Когда Google анонсировала Gemini, я был рад попробовать ее, потому что это мультимодальная модель, которая работает с текстом, изображениями, кодом, аудио и видео. В отличие от ChatGPT, он также может получать доступ к Интернету и предоставлять информацию в режиме реального времени. Однако после более шести месяцев использования Я возвращаюсь в ChatGPT .
На бумаге последняя модель Gemini 1.5 Pro превосходит новый ChatGPT 4.0 от OpenAI. Во-первых, он поддерживает вдвое больше токенов для максимальной длины последовательности по сравнению с ChatGPT, что означает, что он может гораздо лучше понимать контекст подсказок. Он также поддерживает контекстное окно размером до 2 миллионов токенов, что позволяет сохранять предыдущие чаты и загруженные файлы в памяти во время ответа.
Для справки ознакомьтесь с этой таблицей:
Функция | Gemini 1.5 Pro (Google DeepMind) | ChatGPT 4o ( OpenAI) |
---|---|---|
Параметры Обучение | 137B | 1,5B |
Архитектура | Трансформер-XL | Стандартный трансформатор (подробности не разглашаются) |
Данные обучения | Веб-текст, книги, код | Не указано |
Максимальная длина последовательности (входная) | 2048 токенов | 1024 токенов |
Контекстное окно | До 2 миллионов токенов | До 128 000 токенов |
Обратите внимание, что эти подробности раскрываются соответствующими компаниями. Фактический опыт их использования для большинства людей будет другим. Вот мой реальный опыт:
1. Приложение Gemini заменяет Google Assistant на Android
При установке приложения Gemini на Android вы вынуждены использовать Gemini в качестве нашего цифрового помощника, заменяя привычный Google Assistant. Это изменение не приветствуется, поскольку в Gemini отсутствуют многие функции, которые вы ежедневно используете с Google Ассистентом.
Во-первых, я не могу управлять своим умным домом, пользовательские команды для управления приложениями больше не работают, и даже такие нишевые функции, как возможность распознавать песни по напеву, отсутствуют. Кроме того, Gemini с трудом понимает, что я говорю, и работает намного медленнее, чем Google Assistant. Это возможно, поскольку Близнецы все еще «тренируются», используя мои голосовые команды. Google недавно добавил возможность устанавливать напоминания через Gemini. это улучшение давно назрело.
Чтобы продолжать использовать Google Assistant, мне придется отказаться от установки приложения Gemini и использовать его веб-версию. Почему вместо замены Google Assistant Google не может интегрировать возможности Gemini в Google Assistant, например Apple улучшила Siri? . На данный момент я делаю вывод, что у Gemini нет подходящего приложения для Android и есть много недостатков.
Если Gemini заменит Google Assistant на вашем телефоне, вы сможете вернитесь к Google Assistant из Gemini.
2. Чаще всего ошибается в математических расчетах
Недавно я переехал в новую комнату с тремя друзьями. Мы оплатили расходы на дом и хотели в конце разделить их поровну. Я предоставил Gemini подробную информацию о брокерских услугах, авансе, транспортировке и о том, кто сколько заплатил, попросив его рассчитать, кто кому должен платить и сколько, чтобы разделить расходы поровну.
Вот подсказка, которую я дал Близнецам.
I recently moved to a new room with three of my friends, and we paid various expenses without any specific order. Here's the breakdown of our expenses:
1. Advance Payment
Vinay: ₹22,000
Shyam: ₹40,000
Me: ₹10,000
2. Brokerage Fee
Vinay: ₹2,500
Shyam: ₹0
Me: ₹17,500
3. Transportation
Each person: ₹500
4. Purchases
Vinay: ₹11,000
Shyam: ₹20,000
Me: ₹1,800
We want to split all these expenses equally among the four of us. Can you help us calculate who should pay whom and how much to ensure everyone ends up paying the same total amount?
Несмотря на то, что компания Gemini предоставила все подробности, расчеты были полностью испорчены. Предполагалось, что мы с другом должны были заплатить третьему лицу одинаковую сумму, хотя изначально мой друг заплатил больше. Кроме того, там говорилось, что Шьям получит 18 900 фунтов стерлингов, но не пояснялось, кто должен ему платить. Даже после нескольких сообщений с просьбой исправить расчеты, я не смог получить точный ответ.
В конце концов мне пришлось вернуться к ChatGPT, чтобы решить проблему. ChatGPT предоставил чистый и правильный расчет с тем же запросом. Ответ был не только точным, но и объяснение было подробным и ясным.
Это не разовая проблема. Нам также пробовал задавать вопросы по математике нравится решать арифметические операции и находить производные функций, где Близнецы чаще всего терпели неудачу, когда вопросы усложнялись. Это не просто математика; даже с загадками или чем-то еще, требующим рассуждений и логики, у Близнецов больше шансов на неудачу. Было ощущение, что Близнецы еще не готовы к повседневной математике.
3. Непоследовательная и неполная генерация кода
Я не программирую ежедневно, но иногда мне нравится играть с API или узнавать что-то новое как энтузиаст. По результатам моего ограниченного тестирования я могу сказать, что Gemini стала намного лучше, чем в первые дни Bard. Однако ChatGPT по-прежнему превосходит Gemini по уровню мастерства.
Например, я дал Gemini и ChatGPT подробное предложение создать приложение для отслеживания расходов с использованием HTML, CSS и JavaScript:
Build a user-friendly expense tracker web application using HTML, CSS, and JavaScript. The app should allow users to:
Add expenses: Users can enter details like amount, category (optional), and date/time for each expense.
Edit expenses: Provide the ability to modify existing expense entries (amount, category, date/time).
Delete expenses: Users should be able to easily remove unwanted expense entries.
Display expenses: Clearly present a list of all recorded expenses, ideally including relevant details like amount, category, and date/time.
Consider visual elements: Incorporate basic CSS styling to enhance the user experience and make the app visually appealing.
Обе модели пропустили часть расходов на редактирование, но Gemini даже не упомянула об этом. Кроме того, чтобы настроить его и получить выходные данные, мне пришлось вручную исправлять множество мелких ошибок в результатах Gemini.
Основная проблема Gemini для меня заключается в том, что при создании нескольких кодов ему не хватает контекста. Например, я попросил его создать страницу входа, и он успешно это сделал. Однако когда я попросил его сгенерировать серверный сценарий для обработки логики входа в систему, он создал код с новыми переменными, которые не соответствовали остальному коду. Хотя сгенерированный код был технически правильным, мне пришлось устранять больше работы и потенциальных ошибок, чего в большинстве случаев не было в случае с ChatGPT.
4. Отсутствие объяснений и правильной структуры
Хотя Gemini иногда предоставляет подробные объяснения, они часто пропускают эту важную часть и сразу переходят к ответу. Прошу ли я сгенерировать код, решить математическую задачу или загадку или объяснить тему, мне часто приходится запрашивать дополнительные разъяснения, поскольку первоначальный ответ не ясен и не хорошо структурирован.
Например, я дал следующую подсказку:
The ages of 10 students in a class are: 15, 16, 14, 15, 16, 15, 17, 16, 14, and 15. Find the mean age of the students.
Вот ответ от Близнецов:
И вот что я получил от ChatGPT:
Даже когда Gemini предоставляет подробное пошаговое объяснение, я обнаружил, что структура его результатов не такая безупречная, как у ChatGPT. По моему опыту, использование ChatGPT часто приводит к более связному и ясному представлению, хотя это предпочтение может варьироваться от человека к человеку.
5. Распознавание изображений не на уровне ChatGPT
При использовании обоих сервисов я загружал различные типы изображений для разных целей: мемы для пояснений, снимки экрана с сообщениями об ошибках для решения проблем и фотографии объектов для сбора подробностей. По моему опыту, ChatGPT отлично справляется с пониманием изображений и получением соответствующей информации. Google не использует возможности Google Lens, которые часто справляются лучше, чем сам Gemini, когда дело доходит до поиска подробностей о любом объекте, животном или растении.
Еще одна серьезная проблема с Gemini — невозможность доступа к изображениям или файлам, загруженным в предыдущие сообщения. Например, я предоставил Близнецам список математических задач в изображении и попросил решение первой из них, которое он точно предоставил. Однако, когда я запросил решение второй проблемы, Близнецы, похоже, не поняли, о чем я говорю. Даже когда ему было предложено вернуться к изображению, отправленному в предыдущем сообщении, Gemini не смог получить к нему доступ. Я проверил это на нескольких изображениях и файлах, и Gemini всегда мог анализировать только изображения, загруженные в одном сообщении.
Более того, бывают случаи, когда Gemini вообще не подтверждает загруженные изображения. Например, когда я загрузил изображение смартфона и запросил номер его модели, Gemini вместо этого ответил подробностями о собственной версии модели Gemini. Эта проблема сохранялась как в бесплатной, так и в расширенной версии Gemini.
6. Другие незначительные проблемы с Gemini
- Краткий текст. При исследовании или написании статей я использую Gemini для проверки грамматики, фактов или поиска альтернативных слов и предложений. Однако я заметил, что Близнецы часто сокращают текст, даже если я этого не просил. Мне постоянно приходится напоминать, чтобы не сокращать текст без необходимости.
- Забывает контекст. Близнецы часто теряют из виду основную тему, когда я отвлекаюсь на подтему во время чата. Хотя это может произойти со всеми большими языковыми моделями (LLM), в Gemini это случается чаще. Даже когда я пытаюсь напомнить ему об исходной теме, Близнецы иногда могут оставаться в неведении.
7. Отсутствующие функции в Gemini
В Gemini отсутствуют некоторые функции, доступные в ChatGPT:
- Пользовательские инструкции. Эта функция позволяет пользователям устанавливать инструкции по умолчанию для работы ChatGPT в соответствии со своими предпочтениями. Например, пользователи могут поручить ChatGPT объяснять информацию так, как если бы они обращались к 15-летнему подростку,
- Память ChatGPT. ChatGPT включает функцию памяти, позволяющую сохранять сведения, которые вы упомянули о себе или своих предпочтениях во время сеанса чата. Эта память позволяет ChatGPT сохранять контекст при последующих взаимодействиях, обеспечивая более персонализированные ответы на основе предыдущих разговоров.
- GPT: GPT, или генеративные предварительно обученные преобразователи, представляют собой настроенные версии ChatGPT, предназначенные для конкретных задач и содержащие дополнительную информацию и правила. Например, существуют теги GPT, предназначенные для рекомендации книг, а некоторые оптимизированы для таких задач, как составление электронных писем.
- Временный чат. Если вы не хотите, чтобы ChatGPT сохранял какой-либо чат в своей истории или отвечал информацией из своей памяти, вы можете запустить временный чат. Это похоже на режим инкогнито, но для ChatGPT.
- Голосовой чат. Приложение ChatGPT предлагает функцию голосового чата, позволяющую взаимодействовать с ChatGPT с помощью голоса. Хотя Gemini также может работать как голосовой помощник на Android, голосовой чат ChatGPT выглядит более аутентично благодаря человеческому голосу, естественным паузам и ответам, которые не кажутся роботизированными.
Каждая из этих функций может стать основной причиной предпочтения ChatGPT вместо Gemini, поскольку в совокупности они обеспечивают более комплексный, удобный и гибкий интерфейс.
Движение вперед
После продолжительных столкновений с Gemini я вернусь к использованию ChatGPT в качестве основного чат-бота. Я предпочитаю использовать Perplexity или другие альтернативы Perplexity для исследований, поскольку они предоставляют информацию в реальном времени и объясняют ее в виде простых пунктов. Однако я по-прежнему буду использовать Gemini для некоторых задач и целей.