Главная страница » Google DeepMind представляет модель генерации видео Veo 2 для конкурента Sora

Google DeepMind представляет модель генерации видео Veo 2 для конкурента Sora

Автор: Евгений Стерликов

Google DeepMind только что запустил Вео 2, , конкурирующий с Сора из OpenAI . Sora может создавать 20-секундные видеоролики с разрешением до 1080p, а модель Veo 2 от Google может создавать минутные видеоролики с потрясающим разрешением 4K.

Google также утверждает, что Veo 2 может понимать реальную физику и нюансы человеческих движений и выражений — с чем до сих пор сталкиваются такие модели, как Сора. Вот все, что вам нужно знать о новой модели Google Veo 2.

Что нового в модели Google Veo 2?

Ранее в этом году Google анонсировала Veo, свою модель искусственного интеллекта для преобразования текста в видео. Опираясь на это, команда представила обновленный Модель Вео 2.

Одним из самых больших улучшений Veo 2 является понимание реальной физики и движений человека. Например, если вы пробовали такие модели, как Сора, вы могли заметить такие проблемы, как дополнительные пальцы на руке или объекты, не принадлежащие сцене. Veo 2 устраняет эти проблемы, создавая более естественные и последовательные результаты. Google также утверждает, что Veo 2 меньше галлюцинирует по сравнению с другими моделями.

Источник: Google

Кроме того, Veo 2 понимает язык кинематографии. Вы можете указать жанр, тип объектива или кинематографические эффекты, и Veo 2 будет следовать этим инструкциям. Например, вы можете попросить сделать снимки с отслеживанием под низким углом, малой глубиной резкости или объективом 18 мм. 

Источник: Google

Однако Google сообщает, что модели по-прежнему трудно справляться со сложными сценами и сложными движениями.

Источник: Google

Модель также может создавать более длинные видеоролики — до нескольких минут — в сверхвысоком разрешении до 4K. По сравнению с Sora от OpenAI, которая ограничена 20-секундными клипами в разрешении 1080p, это большой шаг вперед. Veo 1, для сравнения, мог создавать только видео продолжительностью до минуты в формате 1080p.

Все видео, созданные с помощью модели Veo 2, будут содержать невидимый водяной знак SynthID, позволяющий идентифицировать их как созданные искусственным интеллектом, что помогает снизить риск дезинформации.

Как использовать Veo 2?

Как и оригинальная модель Veo, Veo 2 не доступен для всех. Прямо сейчас он доступен через инструмент Google VideoFX, который является частью Google Labs. Доступ в настоящее время ограничен, и пользователи могут запишитесь в список ожидания . Хотя Veo 2 поддерживает разрешение 4K и увеличенную продолжительность, текущая реализация VideoFX ограничена разрешением 720p и клипами продолжительностью восемь секунд.

Google также планирует интегрировать Veo 2 в YouTube Shorts в следующем году, открывая больше возможностей для авторов. Для разработчиков и предприятий Veo 2 распространяется через Vertex AI, платформу искусственного интеллекта Google.

Также читайте:

А как насчет Imagen 3?

Помимо Veo 2, Google также обновил модель генерации изображений Imagen 3. Imagen 3 теперь лучше отображает более яркие и детальные изображения. Google также утверждает, что может более точно следовать подсказкам. Imagen 3 доступен в версии ИзображениеFX и будет доступен более чем в 100 странах.

Google не остановился на достигнутом. Они также представили новый экспериментальный инструмент под названием Whisk, который сочетает в себе Imagen 3 с Gemini AI от Google для еще большего творческого контроля. С помощью Whisk вы можете смешивать такие элементы, как предметы, сцены и стили, для создания уникальных изображений. Например, вы можете загрузить изображение, описать сцену и добавить определенный художественный стиль, чтобы создать что-то совершенно новое. Whisk доступен через Google Лаборатории в США, поэтому, если вам интересно, можете попробовать.

Возможно вам будет интересно