Перевод речи в текст: топ-5 программ


перевод речи в текстНи одна программа не сможет полностью заменить ручную работу по расшифровке записанной речи. Однако существуют решения, которые позволяют существенно ускорить и облегчить перевод речи в текст, то есть, упростить транскрибацию.

Содержание:
1. Сайт speechpad.ru
2. Сервис dictation.io
3. RealSpeaker
4. Speechlogger
5. Dragon Dictation

Транскрибация – это запись аудио или видео-файла в текстовом виде. Есть в интернете оплачиваемые платные задания, когда за транскрибацию текста исполнителю выплачивается некоторая сумма денег.

Перевод речи в текст полезен

  • студентам для перевода записанных аудио- или видео-лекций в текст,
  • блогерам, ведущим сайты и блоги,
  • писателям, журналистам для написания книг и текстов,
  • инфобизнесменам, которым нужен текст после проведенного ими вебинара, выступления и т.д.,
  • людям, которым сложно печатать – они могут надиктовать письмо и послать его родным или близким,
  • другие варианты.

Опишем наиболее эффективные инструменты, доступные на ПК, мобильные приложения и онлайн-сервисы.

1 Сайт speechpad.ru

Это онлайн-сервис, который позволяет через браузер Google Chrome переводить речь в текст. Сервис работает с микрофоном и с готовыми файлами. Конечно, качество будет значительно выше, если использовать внешний микрофон и диктовать самому. Однако сервис неплохо справляется даже с видеороликами на YouTube.

https://speechpad.ru/

Нажимаем «Включить запись», отвечаем на вопрос про «Использование микрофона» – для этого кликаем «Разрешить».

Длинную инструкцию про использование сервиса можно свернуть, нажав на кнопку 1 на рис. 3. От рекламы можно избавиться, пройдя несложную регистрацию.

сервис speechpad

Рис. 3. Сервис speechpad

Готовый результат легко редактируется. Для этого нужно либо вручную исправить выделенное слово, либо надиктовать его заново. Результаты работы сохраняются в личном кабинете, их также можно скачать на свой компьютер.

Список видео-уроков по работе с speechpad:

https://speechpad.ru/help.php

Можно транскрибировать видео с Youtube или со своего компьютера, правда, понадобится микшер, подробнее:

Видео «транскрибирование аудио»

 

Работает сервис с семью языками. Есть небольшой минус. Он заключается в том, что если нужно транскрибировать готовый аудио-файл, то его звучание раздаётся в колонки, что создает дополнительные помехи в виде эха.

2 Сервис dictation.io

Замечательный онлайн-сервис, который позволит бесплатно и легко переводить речь в текст.

dictation.io

Рис. 4. Сервис dictation.io

1 на рис. 4 – русский язык можно выбрать в конце страницы. В браузере Google Chrome язык выбирается, а в Мозилле почему-то нет такой возможности.

Примечательно то, что реализована возможность автосохранять готовый результат. Это убережет  от случайного удаления в результате закрытия вкладки или браузера. Готовые файлы этот сервис не распознает. Работает с микрофоном. Нужно называть знаки препинания, когда производите диктовку.

Перейти на сервис: https://dictation.io/

Текст распознается достаточно корректно, орфографических ошибок нет. Можно самостоятельно вставлять знаки препинания с клавиатуры. Готовый результат можно сохранить на своем компьютере.

3 RealSpeaker

Эта программа позволяет легко переводить человеческую речь в текст. Она предназначена для работы в разных системах: Windows, Android, Linux, Mac. С ее помощью можно преобразовывать речь, звучащую в микрофон (например, он может быть встроен в ноутбук), а также записанную в аудиофайлы.

Может воспринимать 13 языков мира. Существует бета-версия программы, которая работает в режиме онлайн-сервиса:

https://transcribe.realspeaker.org/

Нужно перейти по указанной выше ссылке, выбрать русский язык, загрузить на онлайн-сервис свой аудио- или видео-файл и оплатить его транскрибацию. После транскрибации можно будет скопировать полученный текст. Чем больше файл для транскрибации, чем больше времени понадобится на его обработку, подробнее:

 

В 2017-ом году был бесплатный вариант транскрибации с помощью RealSpeaker, в 2018-ом году такой возможности нет. Сильно смущает тот момент, что транскрибированный файл доступен всем пользователям для скачивания, возможно это будет доработано.

Контакты разработчика (ВКонтакте, Facebook, Youtube, Telegram, Твиттер, электронная почта, телефон) программы можно найти на странице его сайта (точнее, в подвале сайта):

http://www.realspeaker.me/ru

4 Speechlogger

Альтернатива предыдущему приложению для мобильных устройств, работающих на Android. Доступно бесплатно в магазине приложений:

https://chrome.google.com/webstore/detail/speech-recognition-transl/jjgohjmefljmabkekbfgfhockfegohfp?hl=ru

Текст редактируется автоматически, в нем расставляются знаки препинания. Очень удобно для того, чтобы надиктовывать себе заметки или составлять списки. В результате текст получится весьма достойного качества.

5 Dragon Dictation

Это приложение, которое распространяется бесплатно для мобильных устройств от компании Apple.

Программа может работать с 15 языками. Она позволяет редактировать результат, выбирать из списка нужные слова. Нужно четко проговаривать все звуки, не делать лишних пауз и избегать интонации. Иногда возникают ошибки в окончаниях слов.

Приложение Dragon Dictation   используют обладатели яблочных гаджетов, например, чтобы, перемещаясь по квартире, надиктовать список покупок в магазине. Приду туда, можно будет посмотреть на текст в заметке, и не надо слушать.

Какую бы программу Вы ни использовали в своей практике, будьте готовы перепроверять результат и вносить определенные коррективы. Только так можно получить безукоризненный текст без ошибок.

Также полезные сервисы:

1. Программы для создания электронной книги

2. Оповещения Google Alerts – зачем и как пользоваться, примеры использования

3. Голосовой поиск на компьютере через Гугл Хром или Яндекс Браузер





Получайте актуальные статьи по компьютерной грамотности прямо на ваш почтовый ящик.
Уже более 3.000 подписчиков

.

Важно: необходимо подтвердить свою подписку! В своей почте откройте письмо для активации и кликните по указанной там ссылке. Если письма нет, проверьте папку Спам.

 


Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *


Комментарии: 17 к “Перевод речи в текст: топ-5 программ”

  • Татьяна:

    Прям сейчас пробую сервис: dictation.io/.
    Транскрибирует-то хорошо, но в обратном порядке! Например, “мама мыла раму”, транскрибирует “раму мыла мама”. Что делать, не пойму((

  • gleb:

    Есть хороший сервис для этих целей – upsaleslab.ru.
    В нем можно легко сгенерировать озвучку любого текста, и сразу же наложить на видео. Более 25 голосов на 20 языков мира – на любой вкус, рекомендую!

  • Vadym:

    Учу немецкий. Ваша программа помогла при транскрибации немецких аудиофайлов с использованием виртуального кабеля. Спасибо большое! Удачи!

  • Автор:

    Надежда, что по Вашему возможно сделать, если сохранённые архивы впоследствии невозможно открыть + периодически-обусловлено, возникают блокировки интернет-соединений и срабатываний – на уровне изменений функций системных файлов и переферийных “Алиса”-устройств (; как чайник, ничего не могу противопоставить, а IT-спецы отказываются комментировать …)??? Спасибо, заранее, за профессиональный ответ. Дмитрий Мадьянов.

    • Надежда:

      Дмитрий, важные архивы желательно хранить не в облаках и не в локальных сетях, а на внешних жестких дисках или на флешках. Тогда сисадмины не смогут вмешиваться в процесс архивации или восстановления. Если же архив уже хранится в сети или в облаке, в сисадмины не дают к нему доступ или блокируют длительные соединения, то лучше всего попробовать «достучаться» до архива из другой сети Интернет, подключившись на время к другому провайдеру Интернета. Правда, обойти защиту, установленную сисадминами, обычно непросто. Лучше всего найти с сисадминами «общий язык», и просто уговорить их помочь Вам – поверьте, это самый простой и результативный путь.

  • Нурилло Аббосхон Гозиев:

    Хочу подключиться

  • Андрей:

    RealSpeaker – генератор бреда. Заплатил 100 руб. за транскрибацию 15 минут интервью. На выходе получил набор бессмысленных слов. Вот фрагмент:

    ровно час проговорили телефон достопримечательности заправки КПД процесса w3hc брага для кальвадоса брага из фильма Разумное брага для кальвадоса сидра сейчас я думал что это просто как Криштиану Пусть кроме крепости таких никаких различных Нет это уже не сижу поэтому, будто Брат за брата выдаст это случилось такое достаточно средств и всё сухой я беру всё чтобы вернула эту песню что хочется в свой напиток самый приятный для употребления внутрь Попробовать там перекашивает лицо не перекопана просто.

    • Надежда:

      Машинные технологии переводы не идеальны. Многое зависит от дикции говорящего, а также от качества записи. В случае наличия проблем с дикцией или с записью, лучше обращаться на биржи фриланса типа воркзилла, где “вручную” будет сделана транскрибация текста (перевод речи в текст). На бирже оплата списывается с аккаунта заказчика после того, как заказчик примет работу.
      Вы можете обратиться к Виктору Озерову, разработчику RealSpeaker по вопросу возврата денег.

    • Виктор Осетров:

      Андрей, речь – это всегда индивидуально. Многое зависит от внешних параметров типа – на сколько далеко диктор от микрофона, качество звука, на сколько диктор чисто произносит голос, многоголосие и так далее. Вы можете зайти в медиа – https://realspeaker.net/media и почитать результаты других распознанных файлов. В большинстве случаев качество просто отменное.
      Также у нашего продукта есть политика возврата. Если не понравился результат внизу слева сайта есть иконка для обратной связи – там лишь надо написать, что качество не устраивает – в таком случае мы возвращаем деньги – для нас принципиально важно, чтобы клиент был доволен и приходил к нам снова и снова.

  • Станислав:

    1 RealSpeaker-воспользовался сервисом деньги ушли перевода нет звука в текст, тех поддержка контакты -отсутствуют в соц сетях тишина вопрос “???” что за фигня и не “кидалово” ли этот сервис?
    2 Вы его рекомендуете вопрос насколько ваш портал надёжный источник?

    • Надежда:

      Если проскроллить страницу
      realspeaker.me/ru
      вниз, то там полным-полно контактов: ВКонтакте, Фейсбук, Ютуб, Твиттер, Телеграм, электронная почта, телефон.
      Я почитала отзывы ВКонтакте за 9 февраля, там есть и возврат денег. Виктор Осетров, один из разработчиков сервиса, живет во Франции, судя по номеру его телефона, а там сдвиг по времени, и если Вы писали, то надо подождать ответ. Техподдержку оказывает сам разработчик сервиса.

      Что касается моей статьи, она написана в июле 2017 года, когда там была возможность бесплатно попробовать, как работает на сайте бесплатный онлайн-сервис по транскрибации речи в текст. Оказывается, что в феврале 2018 года разработчик изменил политику предоставления услуг, там теперь бесплатного нет. И сейчас проводится платная транскрибация предварительно загруженного файла. В статье я отредактировала информацию про этот сервис.

    • Виктор Осетров:

      Станислав! Извините если мы немного задержали обработку медиа файла. Надежда правильно отметила, у нас есть небольшая разница во времени – я живу во Франции и бывает сложно оперативно отвечать ночью. Так как приходиться запускать файлы в обработку иногда вручную. Так как не всегда срабатывает автоматика. Также если не устраивает качество распознавания – делаем возврат.

      До середины февраля наш сервис был полностью бесплатным. Сейчас мы в пробном порядке добавили монетизацию – стоимость 7 руб за минуту. Также добавляем личный кабинет. Так как файлы находятся в общем доступе и удаляются автоматически в течение 24 часа. Если Вам нужно, чтобы никто не видел Ваш файл внизу страницы есть чат для обратной связи – напишите туда и мы сделаем Ваш файл приватным.

      Если что, мы всегда рады помочь.
      С уважением,
      Виктор Осетров

  • Владислав:

    Какие непонятливые (были в том числе) эти программисты!… Ведь: НАПИСАНИЕ ПРОГРАММ ЧЕЛОВЕКОМ ЛИШЬ ЗНАЮЩИМ ЯЗЫКИ ПРОГРАММИРОВАНИЯ- перестанет быть обязательным, если создать в памяти компьютеров всего-лишь словарь различных коротких предложений слов, написанных на русском или (и) других языках человеческого общения, каждое из которых представляет собой определённую команду обращённую к компьютеру, для её выполнения им, и переводится им легко, так как в этом словаре каждая из этих команд- словесных предложений, имеют чёткий перевод в нём при помощи языка программирования, в виде определённого алгоритма действий (либо комплекса взаимосвязанных друг с другом множества таковых алгоритмов), которые компьютер и исполняет как адресованные к нему человеком команды! Допустим, например: человек не знающий азов компьютерного программирования, говорит компьютеру, при помощи клавиатуры компьютера печатая предложение: хочу создать свою собственную игру! Компьютер переводит это предложение (дабы иногда и в базе таковых словарных данных интернета, он способен будет мгновенно в таком же как у него словаре, но более глобальном, отыскать правильный перевод этого, и любого словесного предложения, на свой язык состоящий из системы алгоритмов), и в памяти своего ПО, либо опять в интернете, находит правильное действия для себя выполняемое им в качестве ответа на это словесное предложение человека, которое заключается в его первом вначале вопросе адресованном к этому человеку, которым он переспросит человека, дабы устранить этим случайную ошибку: вы хотите создать свою собственную игру?, а после того, как человек ответит ему: Да!, он задаст уже второй ему вопрос, такой: какую вы хотите создать игру, на какую тему она должна быть? И Т.Д., И Т.П.!, таким образом компьютеру человек и сможет подробно рассказать любую информацию в предложениях словесных, которые компьютер полностью будет понимать, в том числе будет он понимать соответственно и то, какие персонажи должны быть в этой игре, и какое у них должно быть в ней поведение!… Подобным образом, и любые другие программы и действия компьютер будет мочь совершать по просьбе к нему адресованной человеком!!! Желаю вам счастья!!!

    • Надежда:

      Вы употребили немало интересных терминов в Вашем обращении. Позвольте и мне применить более сложную терминологию, чтобы пояснить Вам свою позицию по поднятой теме.
      Собачки, кошечки и другие домашние животные тоже понимают отдельные слова и команды человеческой речи. И выполняют их с заданной точностью. А в цирке можно увидеть «чудеса» и покруче.
      С компьютерами то же самое. Да, речь они уже «понимают», отдельные команды выполняют, искусственный интеллект вышел из лабораторий и используется на практике. Но до того момента, когда компьютер начнет «мыслить», а именно это Вы и предлагаете, должно пройти еще немало времени.
      Математически доказано, а математика наука точная, что фон-Неймановская архитектура компьютеров позволяет создавать языки только с ограниченными контекстными условиями. То есть, компьютеру (с современной архитектурой) не под силу наши человеческие контекстно связанные языки (когда значения слов и выражений практически всегда зависит от контекста, в котором они употребляются).
      С помощью языков с ограниченными контекстными условиям нельзя смоделировать систему, работающую на контекстно связанном языке, так как ограниченные контекстные условия – это на порядок ниже по уровню развития, чем контекстная связанность.

      Говоря более простым языком, современные компьютеры с фон-Неймановской архитектурой никогда не смогут научиться понимать человеческую речь настолько, чтобы стать полноправным собеседником и делать все то, что подразумевается нашей контекстно связанной речью. Это невозможно технически, и доказано математически.
      Но идут разработки компьютеров с другой архитектурой, что-то типа нейронных сетей, близких по своему устройству к человеческому мозгу. Вот там, пожалуй, и произойдет прорыв. Осталось немного подождать!

  • Александр:

    Спасибо. Обязательно попробую!

  • Николай:

    Спасибо Надежда! На Хроме программа работает отлично! Желаю удачи и благополучия.