• FaceBook
  • Google Plus
  • Twitter
  • Vkontakte
  • RSS via FeedBurner
  • Email FeedBurner

Перевод речи в текст: топ-5 программ



перевод речи в текстНи одна программа не сможет полностью заменить ручную работу по расшифровке записанной речи. Однако существуют решения, которые позволяют существенно ускорить и облегчить перевод речи в текст, то есть, упростить транскрибацию.

Содержание:
1. RealSpeaker
2. Сайт speechpad.ru
3. Сервис dictation.io
4. Dragon Dictation
5. Speechlogger

Транскрибация – это запись аудио или видео-файла в текстовом виде. Есть в интернете оплачиваемые платные задания, когда за транскрибацию текста исполнителю выплачивается некоторая сумма денег.

Перевод речи в текст полезен

  • студентам для перевода записанных аудио- или видео-лекций в текст,
  • блогерам, ведущим сайты и блоги,
  • писателям, журналистам для написания книг и текстов,
  • инфобизнесменам, которым нужен текст после проведенного ими вебинара, выступления и т.д.,
  • людям, которым сложно печатать – они могут надиктовать письмо и послать его родным или близким,
  • другие варианты.

Опишем наиболее эффективные инструменты, доступные на ПК, мобильные приложения и онлайн-сервисы.

1 RealSpeaker

Эта программа позволяет легко переводить человеческую речь в текст. Она предназначена для работы в разных системах: Windows, Android, Linux, Mac. С ее помощью можно преобразовывать речь, звучащую в микрофон (например, он может быть встроен в ноутбук), а также записанную в аудиофайлы.

Практика показывает, что программа корректно расставляет знаки препинания, не допускает орфографических ошибок. Поэтому редактировать полученный текст придется недолго.

Может воспринимать 13 языков мира. Существует бета-версия программы, которая раздается бесплатно. Программу можно не устанавливать, а при наличии интернета просто воспользоваться онлайн-сервисом.

сервис RealSpeaker транскрибация

Рис. 1. Говорим, а сервис RealSpeaker в режиме онлайн это печатает

Я попробовала этот сервис в режиме онлайн, не скачивая бесплатный вариант программы. Мне он понравился.

1) Чтобы перевести речь в текст онлайн, переходим по ссылке

http://www.realspeaker.me/ru

2) Нажимаем кнопку «Старт». Соглашаемся на использование микрофона.

разрешить использовать микрофон

Рис. 2. Нажимаем «Диктовать», затем внятно говорим, а RealSpeaker записывает это

3) Четко произносим текст. Если нужны знаки препинания, то прямо так и говорим в конце предложения: «точка» или «знак вопроса», либо «восклицательный знак».

4) Текст, который в то время, когда мы говорим, печатается сам – просто чудо!

  • Когда текст надиктован, выделяем его,
  • копируем в буфер обмена (например, с помощью горячих клавиш Ctrl+C),
  • переходим в текстовый редактор, в соцсеть или куда-то еще, где нужно вставить текст,
  • ставим там курсор и жмем горячие клавиши Ctrl+V.

Посмотрите видео «2 0 RealSpeaker (русская версия)», где разработчик в режиме онлайн показывает, как он говорит, а в это время текст с помощью его сервиса печатается на экране:

2 Сайт speechpad.ru

Это онлайн-сервис, который позволяет через браузер Google Chrome переводить речь в текст. Сервис работает с микрофоном и с готовыми файлами. Конечно, качество будет значительно выше, если использовать внешний микрофон и диктовать самому. Однако сервис неплохо справляется даже с видеороликами на YouTube.

https://speechpad.ru/

Нажимаем «Включить запись», отвечаем на вопрос про «Использование микрофона» – для этого кликаем «Разрешить».

Длинную инструкцию про использование сервиса можно свернуть, нажав на кнопку 1 на рис. 3. От рекламы можно избавиться, пройдя несложную регистрацию.

сервис speechpad

Рис. 3. Сервис speechpad

Готовый результат легко редактируется. Для этого нужно либо вручную исправить выделенное слово, либо надиктовать его заново. Результаты работы сохраняются в личном кабинете, их также можно скачать на свой компьютер.

Список видео-уроков по работе с speechpad:

https://speechpad.ru/help.php

Можно транскрибировать видео с Youtube или со своего компьютера, правда, понадобится микшер, подробнее:

Видео «транскрибирование аудио»

 

Работает сервис с семью языками. Есть небольшой минус. Он заключается в том, что если нужно транскрибировать готовый аудио-файл, то его звучание раздаётся в колонки, что создает дополнительные помехи в виде эха.

3 Сервис dictation.io

Замечательный онлайн-сервис, который позволит бесплатно и легко переводить речь в текст.

dictation.io

Рис. 4. Сервис dictation.io

Примечательно то, что реализована возможность автосохранять готовый результат. Это убережет  от случайного удаления в результате закрытия вкладки или браузера. Готовые файлы этот сервис не распознает. Работает с микрофоном. Нужно называть знаки препинания, когда производите диктовку.

Перейти на сервис:

https://dictation.io/

1 на рис. 4 – русский язык можно выбрать в конце страницы. В браузере Google Chrome язык выбирается, а в Мозилле почему-то нет такой возможности.

Текст распознается достаточно корректно, орфографических ошибок нет. Можно самостоятельно вставлять знаки препинания с клавиатуры. Готовый результат можно сохранить на своем компьютере.

4 Dragon Dictation

Это приложение, которое распространяется бесплатно для мобильных устройств от компании Apple.

Программа может работать с 15 языками. Она позволяет редактировать результат, выбирать из списка нужные слова. Нужно четко проговаривать все звуки, не делать лишних пауз и избегать интонации. Иногда возникают ошибки в окончаниях слов.

Приложение Dragon Dictation   используют обладатели яблочных гаджетов, например, чтобы, перемещаясь по квартире, надиктовать список покупок в магазине. Приду туда, можно будет посмотреть на текст в заметке, и не надо слушать.

5 Speechlogger

Альтернатива предыдущему приложению для мобильных устройств, работающих на Android. Доступно бесплатно в магазине приложений:

https://chrome.google.com/webstore/detail/speech-recognition-transl/jjgohjmefljmabkekbfgfhockfegohfp?hl=ru

Текст редактируется автоматически, в нем расставляются знаки препинания. Очень удобно для того, чтобы надиктовывать себе заметки или составлять списки. В результате текст получится весьма достойного качества.

Какую бы программу вы ни использовали в своей практике, будьте готовы перепроверять результат и вносить определенные коррективы. Только так можно получить безукоризненный текст без ошибок.

Также полезные сервисы:

Программы для создания электронной книги

Оповещения Google Alerts – зачем и как пользоваться, примеры использования



P.P.S. Чтобы подписаться на получение новых статей, которых еще нет на блоге:
1) Введите Ваш e-mail адрес в эту форму:


2) На Ваш e-mail придёт письмо для активации подписки. Обязательно кликните по указанной там ссылке, чтобы подтвердить добровольность своей подписки: подробнее с видеоуроком

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *


Комментарии: 4 к “Перевод речи в текст: топ-5 программ”

  • Владислав:

    Какие непонятливые (были в том числе) эти программисты!… Ведь: НАПИСАНИЕ ПРОГРАММ ЧЕЛОВЕКОМ ЛИШЬ ЗНАЮЩИМ ЯЗЫКИ ПРОГРАММИРОВАНИЯ- перестанет быть обязательным, если создать в памяти компьютеров всего-лишь словарь различных коротких предложений слов, написанных на русском или (и) других языках человеческого общения, каждое из которых представляет собой определённую команду обращённую к компьютеру, для её выполнения им, и переводится им легко, так как в этом словаре каждая из этих команд- словесных предложений, имеют чёткий перевод в нём при помощи языка программирования, в виде определённого алгоритма действий (либо комплекса взаимосвязанных друг с другом множества таковых алгоритмов), которые компьютер и исполняет как адресованные к нему человеком команды! Допустим, например: человек не знающий азов компьютерного программирования, говорит компьютеру, при помощи клавиатуры компьютера печатая предложение: хочу создать свою собственную игру! Компьютер переводит это предложение (дабы иногда и в базе таковых словарных данных интернета, он способен будет мгновенно в таком же как у него словаре, но более глобальном, отыскать правильный перевод этого, и любого словесного предложения, на свой язык состоящий из системы алгоритмов), и в памяти своего ПО, либо опять в интернете, находит правильное действия для себя выполняемое им в качестве ответа на это словесное предложение человека, которое заключается в его первом вначале вопросе адресованном к этому человеку, которым он переспросит человека, дабы устранить этим случайную ошибку: вы хотите создать свою собственную игру?, а после того, как человек ответит ему: Да!, он задаст уже второй ему вопрос, такой: какую вы хотите создать игру, на какую тему она должна быть? И Т.Д., И Т.П.!, таким образом компьютеру человек и сможет подробно рассказать любую информацию в предложениях словесных, которые компьютер полностью будет понимать, в том числе будет он понимать соответственно и то, какие персонажи должны быть в этой игре, и какое у них должно быть в ней поведение!… Подобным образом, и любые другие программы и действия компьютер будет мочь совершать по просьбе к нему адресованной человеком!!! Желаю вам счастья!!!

    • Надежда:

      Вы употребили немало интересных терминов в Вашем обращении. Позвольте и мне применить более сложную терминологию, чтобы пояснить Вам свою позицию по поднятой теме.
      Собачки, кошечки и другие домашние животные тоже понимают отдельные слова и команды человеческой речи. И выполняют их с заданной точностью. А в цирке можно увидеть «чудеса» и покруче.
      С компьютерами то же самое. Да, речь они уже «понимают», отдельные команды выполняют, искусственный интеллект вышел из лабораторий и используется на практике. Но до того момента, когда компьютер начнет «мыслить», а именно это Вы и предлагаете, должно пройти еще немало времени.
      Математически доказано, а математика наука точная, что фон-Неймановская архитектура компьютеров позволяет создавать языки только с ограниченными контекстными условиями. То есть, компьютеру (с современной архитектурой) не под силу наши человеческие контекстно связанные языки (когда значения слов и выражений практически всегда зависит от контекста, в котором они употребляются).
      С помощью языков с ограниченными контекстными условиям нельзя смоделировать систему, работающую на контекстно связанном языке, так как ограниченные контекстные условия – это на порядок ниже по уровню развития, чем контекстная связанность.

      Говоря более простым языком, современные компьютеры с фон-Неймановской архитектурой никогда не смогут научиться понимать человеческую речь настолько, чтобы стать полноправным собеседником и делать все то, что подразумевается нашей контекстно связанной речью. Это невозможно технически, и доказано математически.
      Но идут разработки компьютеров с другой архитектурой, что-то типа нейронных сетей, близких по своему устройству к человеческому мозгу. Вот там, пожалуй, и произойдет прорыв. Осталось немного подождать!

  • Александр:

    Спасибо. Обязательно попробую!

  • Николай:

    Спасибо Надежда! На Хроме программа работает отлично! Желаю удачи и благополучия.