Главная страница » День 9 из 12 дней OpenAI: большие победы для разработчиков с моделью o1, голосовой связью в реальном времени и инструментами тонкой настройки

День 9 из 12 дней OpenAI: большие победы для разработчиков с моделью o1, голосовой связью в реальном времени и инструментами тонкой настройки

Автор: Евгений Стерликов

Сегодня OpenAI переключила внимание на разработчиков, объявив о крупных обновлениях своих API и тонкой настройке моделей. Если вы создаете приложения с использованием моделей OpenAI, этот день может стать вашим любимым. Вот пошаговое описание всего, что OpenAI представила в этот день разработки.

1. o1 Модель здесь

До сих пор у нас был доступ к API o1-Preview. Однако в версии выпуск модели о1 OpenAI также обеспечивает поддержку API.

Итак, что нового в o1?

  • Это намного умнее и точнее. Он может шаг за шагом решать сложные задачи, обладая хорошими навыками рассуждения, например, писать сложную программу, прогнозировать финансы или анализировать запутанные документы.
  • Теперь он может форматировать ответы в формате JSON, что невероятно полезно для разработчиков, создающих приложения, которым нужны чистые и структурированные данные.
  • o1 также интегрируется с внешними инструментами и API, что позволяет ему беспрепятственно получать оперативные данные, такие как обновления погоды или цены на акции.
  • o1 может «видеть» изображения. Например, если вы загрузите налоговую форму, он сможет ее проанализировать, обнаружить ошибки и объяснить их.
  • Наконец, вы можете контролировать, сколько усилий вы вкладываете в размышления. На быстрые задачи реагирует быстрее. Для более сложных проблем требуется время, чтобы найти более точные ответы.

OpenAI утверждает, что o1 на 60 % эффективнее предварительной версии, что означает более быстрые результаты при использовании меньшего количества токенов (и экономии затрат).

Вы можете начать использовать o1 прямо сейчас, если у вас уже есть план использования OpenAI 5. Другие утверждают, что OpenAI внедряется постепенно.

2. API реального времени получает серьезные обновления

Создавать приложения реального времени стало проще. OpenAI объявила о серьезных улучшениях своего API реального времени, уделив особое внимание скорости, голосовой поддержке и экономической эффективности.

Вот основные моменты:

  • API OpenAI теперь поддерживает WebRTC, что делает голосовые и видеозвонки в реальном времени более плавными. Он идеально подходит для создания таких инструментов, как голосовые помощники, видеоприложения или устройства Интернета вещей, которым требуется реагирование в режиме реального времени.
  • Хорошая новость. Затраты на аудио для GPT-4o были сокращены на 60%. Если вы используете кэшированные аудиовходы, это еще дешевле — на 87,5%.
  • OpenAI также выпустила GPT-4o Mini, меньшую и более дешевую версию GPT-4o для задач реального времени. Это экономически эффективное решение, но достаточно мощное для таких вещей, как виртуальные помощники и другие приложения с голосовым управлением.

Также читайте:

3. Точная настройка предпочтений: настройте свой искусственный интеллект

Для разработчиков, которым нужны модели, адаптированные к их конкретным потребностям, OpenAI предлагает тонкую настройку предпочтений. Этот метод позволяет настраивать модели, обучая их тому, что «предпочтительно», а что нет. Например, если вы создаете приложение для творческого письма, вы можете предоставить две версии: одну с вашим предпочтительным тоном и стилем, а другую — которая вам не нравится. Модель обучается путем сравнения двух версий. 

4. Выпуск Go и Java SDK (бета)

Для разработчиков, которые пишут код на Go или Java, OpenAI просто облегчил жизнь. Они запустили официальные SDK для обоих языков, объединив существующие библиотеки Python, Node.js и.NET. Эти SDK упрощают подключение к API OpenAI в приложениях Go или Java.

Итак, что это значит для вас?

Если вы разработчик или работаете с OpenAI, сегодняшние обновления принесут вам много интересного:

  • o1 здесь и готов к сложным задачам.
  • Голосовые инструменты, работающие в режиме реального времени, дешевле и проще в создании.
  • Настройка моделей теперь стала более гибкой благодаря точной настройке предпочтений.
  • Новые SDK обеспечивают более быструю разработку на Go и Java.

День 9 был полностью посвящен разработчикам, поэтому обычным пользователям он, возможно, не был таким интересным. Но поскольку осталось всего 3 дня, 10-й день может принести что-то каждому. Нам не терпится увидеть, окажутся ли слухи о GPT-4.5, модели Оператора и других сюрпризах правдой. 

Возможно вам будет интересно