Содержание
Google DeepMind только что запустил Вео 2, , конкурирующий с Сора из OpenAI . Sora может создавать 20-секундные видеоролики с разрешением до 1080p, а модель Veo 2 от Google может создавать минутные видеоролики с потрясающим разрешением 4K.
Google также утверждает, что Veo 2 может понимать реальную физику и нюансы человеческих движений и выражений — с чем до сих пор сталкиваются такие модели, как Сора. Вот все, что вам нужно знать о новой модели Google Veo 2.
Что нового в модели Google Veo 2?
Ранее в этом году Google анонсировала Veo, свою модель искусственного интеллекта для преобразования текста в видео. Опираясь на это, команда представила обновленный Модель Вео 2.
Сегодня мы анонсируем Veo 2: нашу современную модель создания видео, которая создает реалистичные высококачественные клипы на основе текстовых или графических подсказок. 🎥
Мы также выпускаем улучшенную версию нашей модели преобразования текста в изображение Imagen 3, доступную для использования в ImageFX через… pic.twitter.com/h6ejHaMUM4
— Google DeepMind ( @GoogleDeepMind) 16 декабря 2024 г.
Одним из самых больших улучшений Veo 2 является понимание реальной физики и движений человека. Например, если вы пробовали такие модели, как Сора, вы могли заметить такие проблемы, как дополнительные пальцы на руке или объекты, не принадлежащие сцене. Veo 2 устраняет эти проблемы, создавая более естественные и последовательные результаты. Google также утверждает, что Veo 2 меньше галлюцинирует по сравнению с другими моделями.
Кроме того, Veo 2 понимает язык кинематографии. Вы можете указать жанр, тип объектива или кинематографические эффекты, и Veo 2 будет следовать этим инструкциям. Например, вы можете попросить сделать снимки с отслеживанием под низким углом, малой глубиной резкости или объективом 18 мм.
Однако Google сообщает, что модели по-прежнему трудно справляться со сложными сценами и сложными движениями.
Модель также может создавать более длинные видеоролики — до нескольких минут — в сверхвысоком разрешении до 4K. По сравнению с Sora от OpenAI, которая ограничена 20-секундными клипами в разрешении 1080p, это большой шаг вперед. Veo 1, для сравнения, мог создавать только видео продолжительностью до минуты в формате 1080p.
Все видео, созданные с помощью модели Veo 2, будут содержать невидимый водяной знак SynthID, позволяющий идентифицировать их как созданные искусственным интеллектом, что помогает снизить риск дезинформации.
Как использовать Veo 2?
Как и оригинальная модель Veo, Veo 2 не доступен для всех. Прямо сейчас он доступен через инструмент Google VideoFX, который является частью Google Labs. Доступ в настоящее время ограничен, и пользователи могут запишитесь в список ожидания . Хотя Veo 2 поддерживает разрешение 4K и увеличенную продолжительность, текущая реализация VideoFX ограничена разрешением 720p и клипами продолжительностью восемь секунд.
Google также планирует интегрировать Veo 2 в YouTube Shorts в следующем году, открывая больше возможностей для авторов. Для разработчиков и предприятий Veo 2 распространяется через Vertex AI, платформу искусственного интеллекта Google.
Также читайте:
- Теперь вы можете попробовать проект Google Astra: мультимодальный ИИ для повседневных задач
- 8 новых функций искусственного интеллекта в Google Chrome, о которых вам следует знать
- Google анонсирует новую ОС Android XR для устройств VR и AR
А как насчет Imagen 3?
Помимо Veo 2, Google также обновил модель генерации изображений Imagen 3. Imagen 3 теперь лучше отображает более яркие и детальные изображения. Google также утверждает, что может более точно следовать подсказкам. Imagen 3 доступен в версии ИзображениеFX и будет доступен более чем в 100 странах.
Google не остановился на достигнутом. Они также представили новый экспериментальный инструмент под названием Whisk, который сочетает в себе Imagen 3 с Gemini AI от Google для еще большего творческого контроля. С помощью Whisk вы можете смешивать такие элементы, как предметы, сцены и стили, для создания уникальных изображений. Например, вы можете загрузить изображение, описать сцену и добавить определенный художественный стиль, чтобы создать что-то совершенно новое. Whisk доступен через Google Лаборатории в США, поэтому, если вам интересно, можете попробовать.