Главная страница » Как преобразовать запись голоса в текст на компьютере и смартфоне

Как преобразовать запись голоса в текст на компьютере и смартфоне

Автор: Евгений Стерликов

Помните ужасные истории времен распознавания речи в Windows XP? Однако с появлением искусственного интеллекта и машинного обучения это была путаница, транскрипция речи в текст (а не текст в речь ) стала более надежной и эффективной, чем когда-либо. В режиме реального времени их множество приложений для преобразования речи в текст, которые делают это , но что, если вы хотите расшифровать запись голоса в текст? Я составил список лучших решений для преобразования голосовых записей в текст на вашем мобильном телефоне, в веб-браузере и на ПК. Давайте их проверим.

Чтобы проверить точность следующего программного обеспечения, мы будем использовать первую минутную запись это видео на YouTube .

Преобразуйте записи голоса в текст

1. Расшифровать

Транскрайб транскрибирует видео- и аудиозаписи в текст. Хотя приложение бесплатное, оно монетизирует время транскрипции на почасовой основе. По сравнению с вариантами более высокого класса в этом списке, такими как Happyscribe, цены вполне разумные — всего 4,99 доллара. Разработчик не уточняет, использует ли он API преобразования речи в текст, например Google Cloud Input, или собственное решение.

Читать: Лучшее программное обеспечение TTS для Mac

Приложение выдало четкий вывод с пропущенными кое-где пунктуационными знаками. Проблемы возникли только со словами, которые либо были неясны, либо немного искажены. В любом случае приложение все равно выводит ближайшее слово и оценивает транскрипцию. Тем не менее, результат отличный, это явный шаг вперед по сравнению с бесплатными решениями, такими как Bear Converter, и при цене 4,99 доллара за час транскрипции это не обойдется вам дорого.

Точность: 96 %

Установить Transcribe ( iOS )

 

2. Выдра.AI

Otter — отличное приложение для транскрипции для студентов, которое помогает им облегчить утомительную задачу расшифровки заметок. Не только студенты, он одинаково популярен среди профессионалов, которые используют его для расшифровки протоколов встреч и конференций. Несмотря на то, что он предназначен для расшифровки на лету, вы все равно можете загрузить голосовую запись из локального хранилища и расшифровать аудиофайл. Вся транскрипция происходит в облаке, и вы получаете два варианта сценария. Первый черновик представляет собой быструю расшифровку, создаваемую в течение нескольких секунд и может содержать ошибки, однако аудио снова обрабатывается в облаке, что значительно повышает точность расшифровки. Приложение бесплатное и доступно как для Android, так и для iOS. Вы можете расшифровать до 600 минут.

Связанное: Лучшие приложения OCR для iPhone

В ходе тестирования я обнаружил, что приложение по-прежнему очень точное и правильно передает все слова, однако в нем по-прежнему возникают проблемы с пунктуацией. Он также не смог обнаружить никаких изменений в абзацах, но это не имеет большого значения, поскольку я все равно могу потом отредактировать сценарий.

Точность: 94 %

Установить Otter ( Андроид | iOS )

3. Счастливого подписания

Happyscribe — первый онлайн-вариант в этом списке. Это платное предложение, ориентированное исключительно на профессионалов, в том числе журналистов, и цены определенно показывают это: план оплаты по мере использования Happyscribe стоит 12 евро в час. За такие деньги должна быть значимая отдача. Это реализовано в виде высокоразвитого алгоритма машинного обучения Happyscribe, который он использует для идентификации и расшифровки речи. Алгоритм Happyscribe достаточно совершенен, чтобы распознавать несколько разныхговорящих. Он ускоряет процесс второго прохода, предлагая режим тепловой карты, который показывает, где именно в расшифровке у его алгоритма возникли проблемы. Вы также получаете широкий спектр возможностей экспорта файлов: от документов Word и обычных текстовых файлов до SRT с отметкой времени.

Прочитано: Лучшие приложения для одиноких пожилых людей

Он показал невероятные результаты и правильно произнес почти все слова, даже обнаружил изменения в абзацах, что очень удобно, если в разговоре участвуют несколько говорящих. У Happyscribe есть бесплатная пробная версия, которая дает вам доступ к 30-минутной транскрипции. В общем, если вы ищете лучшее в своем классе онлайн-решение для преобразования аудио в текст, Happyscribe — отличный вариант.

Точность: 99 %

Посмотрите Счастливый писец

Счастливый писец

4. Соникс

Sonix очень похож на Happyscribe и нацелен на тот же целевой рынок — бизнес-пользователей, которым нужно надежное решение для транскрипции на основе искусственного интеллекта, которое действительно выполняет свою работу, хотя и за небольшую часть стоимости транскрипции, выполняемой человеком. Цены Sonix отражают это: вы получаете подписку на однопользовательскую лицензию стоимостью 11,25 долларов США в месяц в дополнение к ставке 6 долларов США в час за записи. Если вы хотите обрабатывать большие объемы, это делает его более конкурентоспособным, чем Happyscribe, но последний выигрывает в случаях использования меньшего объема. Sonix также предлагает бесплатную 30-минутную пробную версию, хотя для доступа к ней вам придется ввести данные своей кредитной/дебетовой карты. Мы попробовали и были приятно удивлены качеством транскрипции.

Прочитано: Это лучшее программное обеспечение для транскрипции для Mac

Как и Hyperscribe, Sonix показал чрезвычайно хорошие результаты. Ни одно слово не было записано неправильно. Еще один момент, на который следует обратить внимание: Sonix потребовалось заметно меньше времени для завершения расшифровки, чем Happyscribe.

Точность: 97 %

Посмотрите Соникс

Соникс

 

5. Конвертер файлов Bear

Профессиональное программное обеспечение для транскрипции может стоить дорого! Даже если вам не хватает лучшей в отрасли транскрипции, бесплатные альтернативы предпочтительнее, если ваш бюджет нулевой. Мы опробовали конвертер Bear в качестве бесплатной опции. Это конвертер мультимедиа, который позволяет конвертировать практически любой тип файла в любой другой. Кроме того, онимеет конвертер MP3 в TXT, использующий механизм распознавания речи Baidu.

Хотя распознавание Baidu не было идеальным, оно правильно расшифровало примерно 70 процентов речи. Неплохо для медиаконвертера, который даже не рекламируется как программа для транскрипции! Для транскрипции аудиофайлов существует ограничение в 3 МБ. Вы можете уменьшить размер файла, перекодировав его с более низким битрейтом, но это может только ухудшить распознавание.

Точность: 70 %

Посмотрите Конвертер файлов медведя

Конвертер файлов медведя

6. Sobolsoft Конвертер MP3 в текст

У Sobolsoft более 1500 приложений, и транскрипция аудио — лишь одно из них. Конвертер речи в текст Sobolsoft требует немного больше настроек, чем большинство других. Чтобы он работал, вам понадобится ключ IBM Speech to Text API. Преобразование речи Уотсона в текст дает вам 100 минут транскрипции бесплатно в месяц, после чего оплата производится поминутно. У Sobolsoft есть бесплатная версия и платная версия за 19,99 долларов. Если не считать экрана с ворчанием, я не заметил никакой существенной разницы при использовании бесплатной версии.

Результаты испытаний очевидны, если представить себе IBM Watson. Однако результаты оказались не лучше, чем у некоторых более продвинутых приложений, перечисленных выше, таких как Happyscribe и Otter. Он не распознавал знаки препинания и изменения абзацев.

Точность: 93 %

Посмотрите Соболь Конвертер Mp3 в текст  

Соболь Конвертер Mp3 в текст

 

Заключительные слова

Я выбрал лучшие приложения для преобразования голосовых записей в текст. Otter и Transcribe — лучшие решения для мобильных пользователей. Sonix дешевле, чем Hyperscribe, если вы собираетесь транскрибировать больше. Sobolsoft MP3 to Text немного устарел, но все еще свеж и силен. Какие приложения из этого списка вам нравятся больше всего или если у вас есть лучшее решение, дайте мне знать в комментариях ниже?

Прочитано: Лучшие приложения-телесуфлеры для Android

Возможно вам будет интересно