Главная страница » Для этих авторов выпущена функция автоматического дубляжа на базе искусственного интеллекта YouTube

Для этих авторов выпущена функция автоматического дубляжа на базе искусственного интеллекта YouTube

Автор: Евгений Стерликов

Функция

Автоматическое дубляж YouTube на базе искусственного интеллекта теперь доступна сотням тысяч авторов в Партнерской программе YouTube. Первоначально представленная на VidCon в прошлом году с ограниченным распространением, эта функция теперь доступна каналам, ориентированным на информационный контент, включая учебные пособия и образовательные видеоролики. YouTube планирует в ближайшее время распространить эту технологию на другие типы контента.

Что такое дубляж на YouTube с помощью искусственного интеллекта

Когда авторы загружают видео, YouTube автоматически определяет язык оригинала и создает дублированные версии с помощью искусственного интеллекта. Автоматическое дубляж YouTube на базе искусственного интеллекта поддерживает следующие языки:

  • Английский (для перевода на другие поддерживаемые языки)
  • Французский
  • Немецкий
  • хинди
  • Индонезийский
  • Итальянский
  • Японский
  • Португальский
  • Испанский

Инструмент дубляжа YouTube с искусственным интеллектом создает дубляж для видео на английском языке на всех поддерживаемых языках. Однако когда вы загружаете видео на любом из других поддерживаемых языков, будет создана только английская дубляж. На данный момент вы не можете загрузить видео на французском языке и создать дублированную версию на итальянском языке в соответствии с текущим состоянием реализации автоматического дублирования.

Перейдите в раздел Языки в Студии YouTube, где вы можете просмотреть, опубликовать, отменить публикацию или удалить дублированные версии. Дублированные видео имеют метку автоматическое копирование, и зрители могут переключиться на исходный звук с помощью параметра «Аудиодорожка».

Также читайте:

Как работает дубляж на YouTube с помощью искусственного интеллекта

Новый инструмент дубляжа YouTube использует искусственный интеллект Gemini от Google для создания дублированных версий. Когда создатель впервые загружает видео, Google использует обработку естественного языка (NLP), чтобы автоматически не идентифицировать язык, независимо от акцентов и диалектов. Затем звук транскрибируется в текст с помощью Google Speech-to-Text API. После расшифровки текст переводится на целевой язык(и) с помощью Гугл переводчик , который использует модели нейронного машинного перевода (NMT).

Переведенный текст затем преобразуется в аудио с помощью Google Близнецы ИИ и такой технологии, как WaveNet. Это называется синтетической генерацией голоса. Дублированные звуковые дорожки автоматически синхронизируются с исходным видео и загружаются вместе с видео в Творческую студию YouTube. 

Текущим дубляжам, созданным с помощью искусственного интеллекта, может не хватать идеального тона и эмоциональной точности. Однако YouTube работает над усовершенствованием под названием Expressive Speech. Эта функция, разрабатываемая совместно с Google DeepMind, фокусируется на воспроизведении тона, эмоций и даже атмосферы исходной среды создателя. Это усовершенствование, представленное на мероприятии Сделано на YouTube , обещает сделать автоматическое дублирование более естественным и увлекательным.

Помогаем авторам выйти на глобальную аудиторию

Расширяя возможности дублирования с помощью искусственного интеллекта, YouTube помогает авторам общаться с аудиторией по всему миру и делает контент более инклюзивным. Хотя технология все еще находится на ранней стадии развития, сотрудничество YouTube с Google DeepMind и Google Translate свидетельствует о постоянных улучшениях.

Хотя текущая реализация имеет некоторые ограничения, такие как ограниченное сочетание языков и менее выразительная дубляж, ожидается, что будущие обновления устранят эти пробелы.

Возможно вам будет интересно