Случайны выбор дневника Раскрыть/свернуть полный список возможностей


Найдено 50 сообщений
Cообщения с меткой

text-to-speech - Самое интересное в блогах

Следующие 30  »
rss_habr

«А поговорить?»: как сделать голосового помощника в браузере

Четверг, 22 Декабря 2022 г. 20:08 (ссылка)

Голосовые технологии повсюду: Siri, Алиса, Alexa, финансовые помощники в приложениях банков, например, Альф. Они есть в колонках, телефонах, даже в автомобилях. Но что насчёт браузеров? Когда я начала заниматься разработкой голосового помощника для личного кабинета банка в браузере, то заметила, что не могу вспомнить никаких голосовых интерфейсов в них. Кроме Web Speech API ничего больше и нет — «готовые» нативные возможности в браузере отсутствуют как класс. Поэтому так получается, что создавать пользовательский опыт взаимодействия голосом с браузерами приходится альтернативными способами.

Привет! Меня зовут Ольга Болотова. Я работаю в Альфа-Банке JavaScript-разработчицей, где работаю над голосовым помощником Альфом, и я немного расскажу о голосовых помощниках в браузере.

Читать далее

https://habr.com/ru/post/706700/?utm_source=habrahabr&utm_medium=rss&utm_campaign=706700

Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Как управлять просодией в синтезе речи

Среда, 23 Ноября 2022 г. 15:51 (ссылка)

Привет, Хабр! Меня зовут Дарима Мылзенова, я инженер-исследователь Just AI.

В компании я работаю над задачами синтеза речи. Возможно, вы слышали, как мы синтезировали голос Кроша из Смешариков. В этой статье я хочу поделиться современными методами управления просодией в синтезе речи. Если вас интересует вопрос о том, как можно сделать синтез более реалистичным, то, надеюсь, вам будет полезен этот материал.

Читать далее

https://habr.com/ru/post/701140/?utm_source=habrahabr&utm_medium=rss&utm_campaign=701140

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Автоматический синтез речи: взгляд лингвиста

Пятница, 29 Июля 2022 г. 13:30 (ссылка)

Что первым придет в голову, если перед нами встанет задача автоматического порождения речи по тексту? Вероятнее всего, мы позаботимся о расстановке пауз между словами, постараемся правильно выбрать интонацию фразы и расставить смысловые акценты. Обязательно построим фонетическую транскрипцию: орфография и произношение далеко не всегда однозначно соответствуют друг другу, о чем компьютер не узнает без нашей помощи. Полученную транскрипцию переведем в цифровой сигнал, который затем преобразуем в звуковые колебания.

Читать далее

https://habr.com/ru/post/679838/?utm_source=habrahabr&utm_medium=rss&utm_campaign=679838

Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Теперь наш синтез на 20 языках

Понедельник, 06 Июня 2022 г. 20:35 (ссылка)

hero_image



В нашей прошлой статье мы ускорили наши модели в 10 раз, добавили новые высококачественные голоса и управление с помощью SSML, возможность генерировать аудио с разной частотой дискретизации и много других фишек.



В этот раз мы добавили:




  • 1 высококачественный голос на русском языке (eugeny);

  • Синтез на 20 языках, 174 голоса;

  • В список языков входят 5 языков народов СНГ: калмыцкий, русский, татарский, узбекский и украинский;

  • В список языков входят 5 вариаций на тему романо-германских языков: английский, индийский английский, испанский, немецкий, французский;

  • Также в список языков входят 10 языков народов Индии;

  • Новую значительно улучшенную модель для простановки ударений и буквы ё со словарем в 4 миллиона слов и точностью 100% (но естественно с рядом оговорок);

  • Все модели наследуют все "фишки" прошлого релиза, кроме автоматической простановки ударений для языков отличных от русского;



Пока улучшение интерфейсов мы отложили на некоторое время. Ускорить модели еще в 3+ раза мы тоже смогли, но пока с потерей качества, что не позволило нам обновить их прямо в этом релизе.



Попробовать модель как обычно можно в нашем репозитории и в колабе.

Читать дальше →

https://habr.com/ru/post/669910/?utm_source=habrahabr&utm_medium=rss&utm_campaign=669910

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Как мы подходим к поддержке ML-моделей в синтезе речи

Пятница, 03 Июня 2022 г. 14:27 (ссылка)

Всем привет! Меня зовут Александра Сорока, я занимаюсь синтезом речи в Тинькофф. А это — мой текст о том, зачем вообще думать о долгосрочной поддержке кода и ML-моделей. Я расскажу, почему мы отказались от опенсорсных решений, как работаем с датасетами и разными версиями моделей и как замеряем их качество. Статья может оказаться полезной для всех, кто хочет знать, как ничего не поломать.

Читать далее

https://habr.com/ru/post/669480/?utm_source=habrahabr&utm_medium=rss&utm_campaign=669480

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество
rss_habr

Теперь наш публичный синтез в супер-высоком качестве, в 10 раз быстрее и без детских болячек

Вторник, 12 Апреля 2022 г. 20:58 (ссылка)

hero_image



В нашей прошлой статье про синтез речи мы дали много обещаний: убрать детские болячки, радикально ускорить синтез еще в 10 раз, добавить новые "фишечки", радикально улучшить качество.



Сейчас, вложив огромное количество работы, мы наконец готовы поделиться с сообществом своими успехами:




  • Снизили размер модели в 2 раза;

  • Научили наши модели делать паузы;

  • Добавили один высококачественный голос (и бесконечное число случайных);

  • Ускорили наши модели где-то примерно в 10 раз (!);

  • Упаковали всех спикеров одного языка в одну модель;

  • Наши модели теперь могут принимать на вход даже целые абзацы текста;

  • Добавили функции контроля скорости и высоты речи через SSML;

  • Наш синтез работает сразу в трех частотах дискретизации на выбор — 8, 24 и 48 килогерц;

  • Решили детские проблемы наших моделей: нестабильность и пропуск слов, и добавили флаги для контроля ударения;



Это по-настоящему уникальное и прорывное достижение и мы не собираемся останавливаться. В ближайшее время мы добавим большое количество моделей на разных языках и напишем целый ряд публикаций на эту и смежные темы, а также продолжим делать наши модели лучше (например, еще в 2-5 раз быстрее).



Попробовать модель как обычно можно в нашем репозитории и в колабе.

Читать дальше →

https://habr.com/ru/post/660565/?utm_source=habrahabr&utm_medium=rss&utm_campaign=660565

Метки:   Комментарии (0)КомментироватьВ цитатник или сообщество

Следующие 30  »

<text-to-speech - Самое интересное в блогах

Страницы: [1] 2 3 ..
.. 10

LiveInternet.Ru Ссылки: на главную|почта|знакомства|одноклассники|фото|открытки|тесты|чат
О проекте: помощь|контакты|разместить рекламу|версия для pda