Полезные программы

Перевод речи в текст: топ-5 программ

Ни одна программа не сможет полностью заменить ручную работу по расшифровке записанной речи. Однако существуют решения, которые позволяют существенно ускорить и облегчить перевод речи в текст, то есть, упростить транскрибацию.

Содержание:
1. Транскрибация — что это
2. О проблемах, связанных с переводом речи в текст
3. Сервис oTranscribe в помощь при ручной транскрибации
4. Гугл Документы для автоматического перевода вашей речи в текст
5. Сайт speechpad.ru
6. RealSpeaker
7. Speechnotes
8. Сервис dictation.io
9. Dragon Dictation
10. Биржи фриланса для расшифровки аудио и видео в текст

Что такое транскрибация

Транскрибация – это автоматический или ручной перевод речи в текст, точнее, запись аудио или видео-файла в текстовом виде.

Есть в интернете оплачиваемые платные задания, когда за транскрибацию текста исполнителю выплачивается некоторая сумма денег. В этом случае транскрибацию, в основном, делают вручную.

Однако можно сделать транскрибацию автоматически, с помощью специальной программы, умеющей «слушать» текст и одновременно «печатать» его, превращать в текстовый файл, пригодный для дальнейшего использования.

Перевод речи в текст вручную или с помощью специальной программы полезен

  • студентам для перевода записанных аудио- или видео-лекций в текст,
  • блогерам, ведущим сайты и блоги,
  • писателям, журналистам для написания книг и текстов,
  • инфобизнесменам, которым нужен текст после проведенного ими вебинара, выступления и т.д.,
  • фрилансерам, которые вручную делают перевод речи в текст, для облегчения и ускорения своей работы,
  • людям, которым сложно печатать – они могут надиктовать письмо и послать его родным или близким,
  • другие варианты.

О проблемах автоматического перевода речи в текст

Можно выделить две крупных проблемы перевода речи в текст с помощью программы: качество записанной речи и наличие в записи фона в виде шума, музыки или иных посторонних звуков.

Речь у всех людей разная:

  • настолько быстрая, что слова проглатываются, или, наоборот, очень медленная;
  • с четкой дикцией, как у профессиональных дикторов, или настолько невыразительная, что сложно что-либо разобрать;
  • с отличным произношением или, напротив, с сильным акцентом, например, когда говорит иностранец.

В каких случаях программа автоматической транскрибации будет давать самый наилучший результат перевода речи в текст? Программа будет делать более или менее качественный перевод, когда на записи человек говорит с четкой дикцией, с нормальным темпом речи, без акцента. При этом в записи речи отсутствуют посторонние звуки в виде шума, музыки, разговоров других людей. Тогда можно надеяться на хороший автоматический перевод, не требующий ручных исправлений или с минимальными изменениями.

В остальных случаях, когда речь невыразительная и присутствуют посторонние шумы, перевод с помощью программы или приложения будет значительно хуже. Возможно, какая-то программа или сервис будет выполнять транскрибацию такой речи лучше, чем другие программы и приложения, но все-таки не стоит ожидать чуда.

В некоторых случаях стоит обратиться на биржу фриланса, где живой человек выполнит перевод вручную. Впрочем, здесь тоже нельзя гарантировать высокого качества, поскольку фрилансер может использовать программы автоматической транскрибации, и он может полениться внести в получившийся текст правки.

Опишем наиболее эффективные инструменты, доступные на компьютере, мобильные приложения и онлайн-сервисы для перевода речи в текст.

Сервис oTranscribe для ручной расшифровки аудио в текст

oTranscribe — сервис для ручной транскрибации аудио в текст

Начнем с бесплатного сервиса oTranscribe, который упрощает работу при РУЧНОМ переводе речи в текст.

Бесплатный сайт в помощь при ручной транскрибации аудио в текст https://otranscribe.com/

— Может ли oTranscribe преобразовать аудио в текст автоматически?
— Нет, oTranscribe помогает сделать ручную расшифровку аудио проще и менее трудоемкой.

Этот сервис будет полезен для тех, кто периодически расшифровывает (транскрибирует) аудио в текст. Сервис oTranscribe. Бесплатный.

Для ручной транскрибации на oTranscribe можно выбрать аудио или видео файл со своего компьютера, либо вставить ссылку на видео с Youtube.

В чем удобство сервиса?
Во-первых, все находится в одном окне и не надо ничего устанавливать на компьютер. oTranscribe проще и удобнее, чем другой сайт Express Scribe.

Во-вторых, когда ставишь на паузу, аудио откатывается на пару секунд назад. То есть на те критические секунды, из-за которых приходится перематывать, если что-то не успел. Работа так идет в разы быстрее!

В-третьих, одна кнопка для запуска и пуска, самая удобная на клавиатуре — это клавиша Esc.

Кроме того, минималистичный рабочий стол. Серые поля, ничто не отвлекает от работы. Сервис считает слова и сохраняет историю. Текст сохраняется при обновлении страницы.

Гугл Документы: Вы говорите, а компьютер записывает речь в виде текста

В Гугл Документах есть удобный, бесплатный сервис, когда Вы говорите, и при этом ваша речь сразу воспроизводится в виде текста на экране компьютера. Чтобы использовать такой сервис, понадобится браузер Гугл Хром и аккаунт в Гугле.

Подробнее: Голосовой ввод в Гугл Документах для перевода речи в текст

Сайт speechpad.ru

Это онлайн-сервис, который позволяет через браузер Google Chrome переводить речь в текст. Сервис работает с микрофоном и с готовыми файлами. Конечно, качество будет значительно выше, если использовать внешний микрофон и диктовать самому. Однако сервис неплохо справляется даже с видеороликами на YouTube.

https://speechpad.ru/

Нажимаем «Включить запись», отвечаем на вопрос про «Использование микрофона» – для этого кликаем «Разрешить».

Длинную инструкцию про использование сервиса можно свернуть, нажав на кнопку 1 на рис. 3. От рекламы можно избавиться, пройдя несложную регистрацию.

Рис. 3. Сервис speechpad

Готовый результат легко редактируется. Для этого нужно либо вручную исправить выделенное слово, либо надиктовать его заново. Результаты работы сохраняются в личном кабинете, их также можно скачать на свой компьютер.

Список видео-уроков по работе с speechpad:

https://speechpad.ru/help.php

Можно транскрибировать видео с Youtube или со своего компьютера, правда, понадобится микшер, подробнее:

Видео «Транскрибирование аудио»

 

Работает сервис с семью языками. Есть небольшой минус. Он заключается в том, что если нужно транскрибировать готовый аудио-файл, то его звучание раздаётся в колонки, что создает дополнительные помехи в виде эха.

RealSpeaker

Эта программа позволяет легко переводить человеческую речь в текст. Она предназначена для работы в разных системах: Windows, Android, Linux, Mac. С ее помощью можно преобразовывать речь, звучащую в микрофон (например, он может быть встроен в ноутбук), а также записанную в аудиофайлы.

Может воспринимать 13 языков мира. Существует бета-версия программы, которая работает в режиме онлайн-сервиса:

https://realspeaker.net/

Нужно перейти по указанной выше ссылке, выбрать русский язык, загрузить на онлайн-сервис свой аудио- или видео-файл и оплатить его транскрибацию. После транскрибации можно будет скопировать полученный текст. Чем больше файл для транскрибации, чем больше времени понадобится на его обработку, подробнее:

 

В 2017-ом году был бесплатный вариант транскрибации с помощью RealSpeaker, с 2018 года такой возможности нет. Вероятно для того, чтобы транскрибированный файл был недоступен всем пользователям для скачивания, необходимо наличие галочки напротив «Сделать файл неудачным в течение 24 часов».

На сайте есть онлайн-чат. Кнопка, чтобы начать чат, находится в правом нижнем углу сайта.

Speechnotes

Альтернатива предыдущему приложению для мобильных устройств, работающих на Android. Доступно бесплатно в магазине приложений:

https://play.google.com/store/apps/details?id=co.speechnotes.speechnotes&hl=ru

Текст редактируется автоматически, в нем расставляются знаки препинания. Очень удобно для того, чтобы надиктовывать себе заметки или составлять списки. В результате текст получится весьма достойного качества. Есть платная премиум-версия.

Dragon Dictation

Это приложение, которое распространяется бесплатно для мобильных устройств от компании Apple.

Программа может работать с 15 языками. Она позволяет редактировать результат, выбирать из списка нужные слова. Нужно четко проговаривать все звуки, не делать лишних пауз и избегать интонации. Иногда возникают ошибки в окончаниях слов.

Приложение Dragon Dictation используют обладатели яблочных гаджетов, например, чтобы, перемещаясь по квартире, надиктовать список покупок в магазине. Придя туда, они могут посмотреть на текст в заметке, и не надо слушать.

Какую бы программу Вы ни использовали в своей практике, будьте готовы перепроверять результат и вносить определенные коррективы.

Только так можно будет получить безукоризненный текст без ошибок.

Сервис dictation.io

Замечательный онлайн-сервис, который позволит бесплатно и легко переводить речь в текст. Работает только в браузере Google Chrome.

dictation НЕ работает, если на вашем компьютере установлена Windows 10 ДОМАШНЯЯ версия.

Рис. 4. Сервис dictation.io

1 на рис. 4 – русский язык можно выбрать в конце страницы.

Примечательно то, что реализована возможность автосохранять готовый результат. Это убережет  от случайного удаления в результате закрытия вкладки или браузера. Готовые файлы этот сервис не распознает. Работает с микрофоном. Нужно называть знаки препинания, когда производите диктовку.

Ссылка на сервис: https://dictation.io/

Текст распознается достаточно корректно, орфографических ошибок нет. Можно самостоятельно вставлять знаки препинания с клавиатуры. Готовый результат можно сохранить на своем компьютере.

Подробнее о том, как работать с этим онлайн-сервисом показываю и рассказываю в видео:

 

Расшифровка аудио и видео в текст на биржах фриланса

Что касается ручного перевода, то можно заказать на бирже фриланса расшифровку речи в текст. На бирже фриланса одни пользователи (заказчики) размещают заказ, выбирают исполнителя и оплачивают работу. А другие пользователи (фрилансеры) берут заказы, выполняют необходимую работу и получают за нее оплату.

Как же можно сделать заказ на бирже фриланса? Сначала нужно зарегистрироваться на сайте биржи, то есть пройти там регистрацию. Затем можно будет разместить заказ — задание на транскрибацию.

Для своего заказа на бирже можно выбрать исполнителя — человека, который будет делать транскрибацию. Для этого необходимо, чтобы хотя бы один из потенциальных исполнителей согласился взяться за предложенную работу. Если же никто не взял заказ, то нужно менять его параметры, например, повышать цену за работу.

Оплата за выполненную работу осуществляется не напрямую исполнителю-фрилансеру, а через биржу фриланса. При размещении заказа обычно требуется пополнить счет на сумму, необходимую для выполнения транскрибации. Кроме того, может быть комиссия биржи за посредничество в виде фиксированной суммы или фиксированного процента от суммы заказа. Оплата работы проводится после ее проверки и одобрения заказчиком. Чаще всего сумма отправляется исполнителю одновременно с одобрением его работы заказчиком.

Прежде чем делать заказ, стоит прочитать правила биржи, касающиеся проверки выполненного задания, его оплаты, а также ввода и вывода денег на биржу. Вывод денег нужен, чтобы оставшиеся деньги, планировавшиеся для оплаты других заказов, могли вернуться обратно заказчику, а не остались бы навсегда на бирже.

Ниже предлагаю две известных биржи фриланса, где можно разместить заказ для перевода речи в текст с помощью фрилансера: weblancer.net и freelance.ru.

Две биржи фриланса

Расшифровка аудио и видео в текст (транскрибация) на бирже фриланса weblancer.net:

Биржа фриланса weblancer.net

https://www.weblancer.net/jobs/transkribatciya-97/

Другая биржа, где можно заказать расшифровку аудио/видеозаписей — freelance.ru

Биржа фриланса freelance.ru

https://freelance.ru/projects/?cat=124&spec=612

Дополнительные материалы:

1. Голосовой поиск на компьютере через Гугл Хром или Яндекс Браузер

2. Субтитры в Скайпе для перевода речи в текст во время общения

3. При просмотре роликов на ноутбуке заикается звук

4. Как всегда открывать видео удобным плеером в Windows 10

5. Оповещения Google Alerts – зачем и как пользоваться, примеры использования

Статья впервые была опубликована 5 июля 2017 г.,
последнее обновление 13 мая 2021 г.

Надежда Широбокова

View Comments

  • Это всё, конечно, хорошо, но когда есть задача расшифровать запись достаточно точно, здесь уже ИИ не поможет. Например, при проведении глубинного интервью, маркетинговом исследовании или анализе данных, когда каждое слово респондента имеет значение. Тут уже необходимы услуги специалистов по расшифровке, которые погружаются в контекст и гарантируют точность на уровне 99% для записей в хорошем качестве

  • Как фрилансер часто пользуюсь Спичпадом. Конечно пришлось научиться диктовать "качественно"! иначе потом приходилось много редактировать. А если надо наоборот, перевести текст в голос, использую voicebot.su. Реально удобная программа.

  • Ищу программу преобразующую русскую речь в русский текст, ищу давно.
    Но что поражает, так это объяснения. Весь интернет кишит объяснениями и нахваливаниями. Но никто не даёт ссылку на скачивание.
    И ни на каких браузерах не существует кнопки "скачать".
    Неизвестно почему.
    Только всякая информация о том, чего нету. Чего не выставляют для скачивания. Мне это нужно. Причём, чтобы я скачал такую программу, и навек забыл интернет!!!
    Чтобы она у меня была , например на флэшке. И если куда понадобится, чтобы я её закачал хоть на виндовс ХР, хоть на виндовс 7. Одним словом, чтобы я не заходил в интернет.

    • Яков: Программа есть, но она стоит около 20 тыс. руб. И качество распознования так себе. Пока что лучше чем apihost.ru/speech-to-text сервиса не нашел. Преимущество перед остальными что расставляются автоматом знаки препинания. В других же сервисах просто портянка из слов.

  • Недавно завел свой блог и начал наполнять его статьями, но не так давно появилась потребность в транскрибации видео и аудио в текст. Вручную делать это довольно сложно, да и времени уходит много. Начал искать какую-нибудь программу, которая поможет это сделать автоматически. И вот недавно случайно наткнулся на вашу статью.

  • Можно, также, использовать связку "Телефон" -> "Компьютер".

    Т.е., производить голосовой ввод текста/данных с телефона (под Android) - в программы MS Word (Windows), MS Excel (Windows) и текстовый редактор (Windows).

  • Спасибо за подборку! Добавлю в ваш список еще одну программу, которой сам пользуюсь:
    speechtext.ai/ru
    Для расшифровки и перевода аудио в текст на русском языке, наверное, одно из самых толковых решений, что удалось найти. Из плюсов: точность перевода речи в текст на уровне 80-85%, расставляет пунктуацию. Один минус - она платная.

  • Добрый день, Надежда. Подскажите, пожалуйста - какая самая лучшая программа для просмотра видеофайлов с возможностью перевода речи в текст из них? Дело в том, что есть проблемы со слухом, а хочется учиться. Все обучающие курсы и т.д. предполагают подачу материала именно в формате видео в основном. Пыталась слушать, но не хватает понимания и разборчивости текста. Подсказали. что есть программы, которые преобразуют речь в текст. Спасибо!

    • Здравствуйте. Мне неизвестна надежная хорошая программа перевода речи в текст. Такие программы есть, их много, но все они не идеальные.
      Речь в текст переводится, когда человек сам лично произносит слова в микрофон компьютера или смартфона. Переводчик речи в текст НЕ работает, если одновременно с ним будет работать какая-то программа, издающая звуки. Например, такой программой может быть обучающий курс с воспроизведением слов и музыки. Это связано с тем, что одновременно НЕ работает воспроизведение и запись звуков в одном компьютере.

      Для записи звука компьютера и преобразования его в текст нужен или другой компьютер, или другой смартфон (планшет). Тогда этот второй компьютер или смартфон сможет "услышать" звук из первого компьютера, и затем представить его в виде текста. Таким образом, программу (приложение) для преобразования звука в текст можно установить на смартфон, и с его помощью "слушать" курс на компьютере, а затем получать текст. Но текст будет не на компьютере, а на смартфоне.
      Или наоборот: можно запустить обучающий курс на смартфоне, а запись и преобразование звука делать на компьютере. Тогда текст появится в компьютере.

      Для преобразования звука в текст подобным образом подойдет любая доступная программа или приложение для телефона. Я не пользуюсь такими программами, поэтому не могу ничего посоветовать среди множества имеющихся вариантов.

      Желательно искать текстовые обучающие курсы или электронные книги, их тоже очень много. Также есть курсы с видео и с текстом одновременно, хотя это редко теперь встречается. Вариант курса с видео может оказаться очень сложным из-за проблем с переводом речи в текст.

  • Прекрасная программа для преобразования речи и не могу не поблагодарить разработчиков за их профессионализм все оказалось продумано и лишь незначительная корректировка текста мне понадобилась

Recent Posts

Как получить билет на поезд РЖД за бонусы

У РЖД (Российские Железные Дороги) есть официальный сайт rzd.ru. У программы РЖД Бонус тоже есть…

18 часов ago

Билеты на поезд РЖД передаются в Госуслуги

В Госуслугах появились три новых возможности для пассажира поезда: сведения о билете, архив и возврат…

1 неделя ago

Как в Госуслугах изменить номер телефона, почту или пароль

Можно изменить номер телефона, почту или пароль в Госуслугах. Рассмотрим, как это можно сделать самостоятельно,…

2 недели ago

Яндекс.Календарь: Как создать события и напоминание самому себе

Яндекс.Календарь полезен для напоминания самому себе о важных событиях, например,  чтобы не забыть о рабочих…

4 недели ago

Шрифты для русских букв: коллекция из 6700 шрифтов

Кириллические шрифты содержат русские буквы, то есть, содержат кириллицу. Есть  сайт, где собрана большая коллекция…

4 недели ago

Что означают цвета в календаре РЖД

При покупке билетов на сайте РЖД удобно пользоваться календарем, в котором даты выделены цветами. Всего…

4 недели ago