Главная страница » Теперь вы можете попробовать проект Google Astra: мультимодальный ИИ для повседневных задач

Теперь вы можете попробовать проект Google Astra: мультимодальный ИИ для повседневных задач

Автор: Евгений Стерликов

Представьте, что вы наводите камеру телефона на ингредиенты на кухне и спрашиваете: «Что из этого можно приготовить?» Искусственный интеллект мгновенно определяет ингредиенты и предлагает рецепты, адаптированные к ним. Именно такую ​​умную помощь обещает Google Project Astra. Он основан на новейшей модели искусственного интеллекта Google, Близнецы 2.0 Флэш , и вот все, что вам нужно об этом знать. 

Что такое проект Астра?

По своей сути новый инструмент искусственного интеллекта Google Project Astra представляет собой мультимодальный помощник искусственного интеллекта. Мультимодальность просто означает, что он может одновременно обрабатывать различные типы входных данных, такие как текст, изображения, видео и аудио.

Например, вы можете направить камеру на полку с книгами и спросить Астру: «Какая из них имеет самые высокие отзывы?» Astra может определить названия, проверить онлайн-рейтинги и предложить лучший вариант.

Не только камера, она также может анализировать то, что отображается на экране вашего телефона. Например, если вы просматриваете веб-страницу и наталкиваетесь на термин или продукт, который вам незнаком, вы можете попросить Astra объяснить это или найти дополнительную информацию.

Astra также может выполнять действия на вашем телефоне, например делать заказы онлайн, устанавливать будильник и т. д. Более того, она также может запоминать некоторые вещи. Итак, если вы наведете камеру на рисунок и спросите: «Кто это нарисовал?» Астра воспользуется своей памятью и может ответить: «Это нарисовала твоя дочь».

Думайте об этом как о расширенной версии Google Ассистента, которая слушает и понимает мир так же, как и вы.

Реальные примеры использования

Вот несколько способов использования Astra 

  1. Предположим, вы пытаетесь питаться здоровее. Astra может проанализировать ваш список продуктов (с помощью фото или текста) и порекомендовать заменители для достижения ваших диетических целей.
  2. Предположим, вы попросили Астру запомнить код двери вашей квартиры. Через несколько недель, подойдя к двери, вы можете просто спросить: «Еще раз какой код от двери?» и он мгновенно напомнит вам об этом.
  3. Сфотографируйте бирку на одежде, и Astra расшифрует для вас символы стирки. Он даже может подсказать вам, какие настройки стиральной машины использовать.
  4. Наведите камеру на растение, и Астра скажет вам, подходит ли оно для вашего сада. Астра может запомнить информацию о вашем местонахождении по памяти и сказать: «Это растение хорошо растет в полутени и влажной почве и идеально подходит для вашего сада в Нью-Йорке».

Google также работает над агентами искусственного интеллекта для игр, которые могут предлагать внутриигровые стратегии, например, где размещать войска или какое оружие улучшать и т. д. Кроме того, они экспериментируют с прототипами очков, которые могут видеть, слушать и реагировать с помощью Астра.

Как получить доступ к Astra прямо сейчас

Проект Астра все еще находится на стадии тестирования и сейчас недоступен для широкой публики. Однако вы можете предварительно ознакомиться с возможностями Project Astra с помощью функции «Stream Realtime», доступной в Google AI Studio. Вот как вы можете получить к нему доступ:

  1. Откройте aistudio.google.com/live в браузере мобильного или настольного компьютера.
  2. Войдите в свою аккаунт Google.
  3. Нажмите Показать Gemini и предоставьте необходимые разрешения для доступа к камере и микрофону.
  4. Используйте камеру своего телефона, чтобы показать свое окружение и поговорить с Gemini 2.0 в режиме реального времени. На ноутбуке помимо камеры можно также показывать экран ноутбука.

Помните, что это всего лишь этап предварительного просмотра, и на данный момент инструмент может не поддерживать такие функции, как поддержка нескольких языков и память. 

Также читайте:

Другие проекты на базе Gemini 2.0

Помимо проекта Astra, Google представила и другие инициативы в области искусственного интеллекта, основанные на модели Gemini 2.0. Проект Маринер предназначен для выполнения задач в браузере Chrome, таких как навигация по страницам и сбор данных, что делает его идеальным для повышения производительности. Жюль, с другой стороны, выступает в роли помощника по программированию, помогая разработчикам с рабочими процессами GitHub и задачами по программированию.

Возможно вам будет интересно