-Рубрики

 -Подписка по e-mail

 

 -Поиск по дневнику

Поиск сообщений в Van_Kap

 -Статистика

Статистика LiveInternet.ru: показано количество хитов и посетителей
Создан: 21.07.2008
Записей: 515
Комментариев: 529
Написано: 1381


Программа расшифровки речи в текст

Среда, 23 Ноября 2011 г. 20:45 + в цитатник
Капля_Иван все записи автора
zapisal.com – стенографирование, транскрибирование, расшифровка записей, перевод речи в текст
Программа конвертирования речи в текст

“Друзья! Очень нужна программа, переводящая русскую диктофонную запись в русский же текст. Где бы такую взять?”

“Ответ 1”

“Таких программ для русского языка не существует. Распознавание устной речи – чрезвычайно сложная и серьёзная проблема – как теоретическая, так и практическая. Входит в общую проблему распознавания образов.”

“Ответ 2”

“Я занимался этой темой. Отдельные разработчики обещают кардинально улучшить алгоритм распознавания русской речи в лучшем случае лет через пять. И ещё не известно, хватит ли этого улучшения, чтобы программа справлялась с распознаванием речи любого незнакомого человека (а не диктора, который перед этим “натаскивал” программу на свой голос), да ещё в условиях шумов, в которых обычно делается интервью.

Но если Вам всё равно приходится “снимать” текст с диктофона, могу подсказать, как слегка, процентов на 10, облегчить этот рутинный процесс.

Итак, при снятии текста работа замедляется из-за необходимости постоянно протягивать руку к кнопке диктофона – либо постоянно переходить в окно компьютерного плеера (если запись перенесена с диктофона на компьютер). К тому же из-за этого больше устают руки.

Помочь тут могут так называемые программные транскрайберы (если, конечно, диктофон у Вас цифровой и есть возможность перегнать запись на компьютер). В них остановка/включение воспроизведения аудиофайла осуществляется по горячей клавише без выхода из окна текстового редактора. Кроме того, можно замедлить воспроизведение (подстроив его под скорость набора) без изменения высоты тона (т.е. женский голос останется женским – а не превратится в мужской бас), а также очистить запись от шума. Кроме того, существуют транскрайберы, использующие технологию расставления в тексте аудиометок. Благодаря этому Вы сможете перейти из любого фрагмента текста к соответствующему фрагменту аудиозаписи (работники судов, следователи, секретари научных конференций и т.д. очень любят эту функцию перепроверки).

Итак, бесплатный транскрайбер можете взять по указанной ниже ссылке. Правда на моем компьютере он не заработал, но, может, у Вас получится.

Платный транскрайбер Цезарь можете купить у Центра речевых технологий. Я его пробовал, хорошая штука, но сколько стоит, не знаю.

Наконец, если Вам не нужна функция аудиометок – есть ещё один отличный бесплатаный вариант: аудиопроигрыватель AIMP. Войдя в его настройки, найдите раздел Глобальные клавиши и перенастройте Стоп/Пуск на клавишу Эскейп (Esc) – поверьте, это наиболее удобно, поскольку не приходится задумываться и палец не попадает случайно на другие клавиши). Пункты “Немного перейти назад” и “Немного перейти вперед” настройте, соответственно, на клавиши Ctrl + клавиши курсора назад/вперед (у Вас на клавиатуре есть четыре клавиши со стрелками - выберите две из них). Эта функция нужна, чтобы заново прослушать последний фрагмент или перейти немного вперед.

Наконец, вызвав эквалайзер, Вы можете уменьшить значение Speed и увеличить значение Pitch. При этом Вы заметите, что скорость воспроизведения замедлится, но высота голоса (если хорошо подберёте значение Pitch) – не изменится. Подберите эти два параметра так, чтобы Вы практически синхронно успевали набирать текст, лишь изредка останавливая его. Когда все будет настроено, набор будет занимать у Вас меньше времени, и руки будут уставать меньше.”



Звуковой транскрайбер

Проект “Транскрайбер” занял первое место на конкурсе “Microsoft Office Extensions” в сезоне “Зима-Весна 2007”. Проект интегрирует две технологии Microsoft – текстовый процессор Microsoft Word и Windows Media Player. Шаблон “AhWMPlayer.dot” предназначен для превращения Microsoft Word в полнофункциональный цифровой транскрайбер – аудиотекстовый редактор, используемый для профессионального набора текста с одновременным прослушиванием фонограммы и управлением воспроизведением. Использование концепции аудиометок обеспечивает прямой доступ к любому участку любой фонограммы.

“Кому это может быть интересно”

К самым распространенным категориям пользователей транскрайберов относятся:

– машинистки, “расшифровывающие” фонограммы заседаний акционерных обществ, судебных заседаний, переговоров и так далее;
– журналисты, работающие со звуком записанного интервью;
– преподаватели иностранного языка, использующие фонограммы на занятиях;
– студенты, изучающие иностранные языки;
– частные детективы, работающие с фонограммами.

Демонстрационная версия “Транскрайбер” распространяется свободно. Программа не требует установки электронных ключей. К основным ограничениям демонстрационной версии относится отсутствие поддержки работы с ножной педалью и поддержки темпокоррекции с помощью специального DSP плагина для Windows Media Player.

Коротко о программе “Транскрайбер”


Темпокоррекция Winamp

“Winamp и вообще звук в компе – как замедлить или ускорить воспроизведение?”

Ответ

Темпокоррекцией называется изменение скорости воспроизведения (или темпа) фонограммы без изменения тембра голоса. Плагины для винампа позволяют замедлить скорость воспроизведения для перевода речи в текст на слух.

www.winamp.com/plugin/pacemaker/12689

Темпо-коррекция в винампе: winamp замедлить, плагин винампа




Программа компьютерного стенографирования

Транскрайбер – это устройство, позволяющее значительно ускорить документирование звукозаписей, получаемых оперативным путем, а также звукозаписей совещаний, переговоров, лекций, интервью и т.п. Производительность труда при документировании звукозаписей с использованием транскрайбера может возрасти примерно в 2-3 раза и более по сравнению с работой только при помощи обычного магнитофона. Особенно преимущества транскрайбера ощущаются при печати текстов непрофессиональными операторами.

Транскрайбер “Цезарь” – 5,850 руб.

Теперь о том, каким образом вам может быть полезна программа “Транскрайбер Цезарь”. Если вы когда-нибудь пытались записывать в текстовом виде аудиоинформацию, например, семинар или лекцию, то наверняка вам знакома такая ситуация, когда приходится останавливать запись каждую секунду, потому что Вы не успеваете записывать за ней. А такой метод стенографирования не назовешь удобным, это малоэффективно и занимает много времени. Именно поэтому Транскрайбер Цезарь является одним из лучших программных решений для переноса аудиозаписи в текстовые файлы. К преимуществам этой программы для диктофонов можно отнести:

– возможность замедления воспроизведения аудиозаписи без искажений голоса;
– встроенные электронные фильтры для очистки записи от посторонних шумов;
– увеличение скорости набора текста из аудиозаписи до 10 раз;
– легкое интегрирование в текстовые редакторы семейства MS Windows 2003.

Приведенный здесь список не полностью отражает все возможности, которые получает пользователь, имеющий диктофон. Эти программы позволяют на 100% использовать все возможности современного цифрового диктофона. С их помощью те функции, которыми обладает диктофон, можно использовать гораздо эффективнее.




Программы для расшифровки аудиозаписей в текст

Сразу нужно сказать – программы, автоматически распознающей и переводящей речь в текст, не существует. Во всяком случае, пока. Поэтому расшифровка записей в текст на данный момент производится только ручками. В этой статье представлен обзор программ, помогающих сделать этот нелегкий процесс более удобным, быстрым и качественным.


Речь в текст – это программа перевода речи в текст. Программы распознавания речи, разпознавание русского языка: “Горыныч”, “Диктограф”. Распознавание голоса, других языков – “Dragon NaturallySpeaking”. К сожалению, русский язык ещё не поддерживается.

преобразование текста в речь speech recognition

Если запись понравилась – кнопка “Нравится”
Поделиться с друзьями – кнопка “Поделиться”
Рубрики:  Развитие/Скоро: -чтение и -печатание


Процитировано 3 раз

SPACELilium   обратиться по имени Суббота, 26 Ноября 2011 г. 21:54 (ссылка)

Ответить С цитатой В цитатник
Slovomol   обратиться по имени Новая программа для расшифровки аудиозаписей/видеозаписей в текст Среда, 30 Октября 2013 г. 13:36 (ссылка)
Представляем Вашему вниманию новую программу для расшифровки аудиозаписей в текст - редактор и плеер Slovomol, скачать можно здесь hhtp://www.2text.ru/ . Функционал включает в себя временные метки и расстановку собеседников, автозамены, автоматические теги для плохого качества записей ("неразборчиво"), возможности разбивки транскрипта на секции - смысловые части текста или абзацы, привязка секций к соответствующей части аудио и возможность возвращать движок плеера в нужную часть аудио одним кликом по секции/временной метке. Набор текста и корректура/финальная вычитка значительно облегчаются благодаря этим функциям. Сокращается время работы транскрибера над заданием. Есть возможность дробления аудиофайла на части и "склейки" финального текста, полученного от разных наборщиков, что идеально для работы целой команды наборщиков текста и корректоров. Редактор работает не на всех операционных системах семейства Windows. В частности, поддержка Windows XP ограничена. Если вы знаете, что у вас Windows XP версии SP3 - смело устанавливайте, в процессе установки редактор попросит вас только обновить Windows Media Player до версии 10. Если версия Windows ниже SP3, то редактор не запустится. Если вы не уверены в версии операционной системы - пробуйте установить. Программа установки сама определит версию операционной системы и отменит установку в случае необходимости.
Ответить С цитатой В цитатник
Аноним   обратиться по имени Вторник, 20 Мая 2014 г. 14:14 (ссылка)
Исправьте hhtp на http.
Ответить С цитатой В цитатник    |    Не показывать комментарий
Аноним   обратиться по имени Воскресенье, 02 Августа 2015 г. 22:51 (ссылка)
Сири уже распознаёт русский текст, причём неплохо. Значит, вопреки здесь написанному, это технически уже осуществимо. Где можно найти сервис, который это делает?
Ответить С цитатой В цитатник    |    Не показывать комментарий
Piper_Bernadotte   обратиться по имени Среда, 05 Октября 2016 г. 04:15 (ссылка)
Мне кажется вот это видео тоже поможет - https://www.youtube.com/watch?v=45Zmu1RmoKs
Ответить С цитатой В цитатник
Комментировать К дневнику Страницы: [1] [Новые]
 

Добавить комментарий:
Текст комментария: смайлики

Проверка орфографии: (найти ошибки)

Прикрепить картинку:

 Переводить URL в ссылку
 Подписаться на комментарии
 Подписать картинку