Speech

Материал из ALT Linux Wiki

(Различия между версиями)
Перейти к: навигация, поиск
(Механизм унифицированной работы с речевыми синтезаторами)
Строка 14: Строка 14:
=== Механизм унифицированной работы с речевыми синтезаторами ===
=== Механизм унифицированной работы с речевыми синтезаторами ===
-
Идея унифицированного вызова речевых синтезаторов заключается в том, чтобы перенаправлять речевую информацию от всех программ источников не напрямую в синтезатор, а в некоторое промежуточное программное обеспечение для предварительной обработки. Такой подход даёт возможность модифицировать порядок вызова синтезаторов и распространить изменения на все источники речи в системе. Также это позволяет исключить наложение звука при одновременном воспроизведении от разных программ.
+
Идея унифицированного вызова речевых синтезаторов заключается в том, чтобы перенаправлять речевую информацию от всех программ источников не напрямую в синтезатор, а в некоторое промежуточное программное обеспечение для предварительной обработки. Такой подход даёт возможность модифицировать порядок вызова синтезаторов и распространить изменения на все источники речи в системе. Также это позволяет исключить наложение звука при одновременном воспроизведении от разных программ. В '''ALT Linux''' вывод речи выполняет речевой сервер <tt>VoiceMan</tt>. Также для этих задач может применяться <tt>Speech Dispatcher</tt>. Любые идеи о том, как можно интегрировать <tt>Speech Dispatcher</tt> в описываемую схему приветствуются. На текущий момент эта разработка собрана и помещена в репозитарий. Пользователь может её установить и работать с ней, но все конфигурационные операции необходимо выполнять вручную. Описание внутреннего устройства <tt>VoiceMan</tt> можно прочитать в [http://git.altlinux.org/people/dottedmag/public/docs-speech.git?p=docs-speech.git;a=blob_plain;f=SpeechPlatform-VoiceMan.pdf;hb=HEAD документе] с описанием архитектуры вывода речи на его основе.
-
* [http://git.altlinux.org/people/dottedmag/public/docs-speech.git?p=docs-speech.git;a=blob_plain;f=SpeechReport-2008-05-17.pdf;hb=HEAD Обзор состояния речевых технологий в ALT Linux]
+
-
* [http://git.altlinux.org/people/dottedmag/public/docs-speech.git?p=docs-speech.git;a=blob_plain;f=SpeechPlatform-VoiceMan.pdf;hb=HEAD VoiceMan в ALT Linux]
+

Версия 07:43, 16 октября 2008

Freesource-logo.png Blue Glass Arrow.svg MediaWiki logo.png
Эта страница была перемещена с freesource.info.
Эта страница наверняка требует чистки и улучшения — смело правьте разметку и ссылки.
Просьба по окончанию убрать этот шаблон со страницы.


Речевые технологии

На этой странице рассматриваются основные вопросы работы с речевыми синтезаторами с точки зрения их применения как средства вывода информации при работе на компьютере без зрительного контроля. Сейчас подготовлены к работе следующие синтезаторы:

  • festival;
  • espeak;
  • flite;
  • mbrola;
  • freetts;
  • ru_tts.

Не все из приведённых синтезаторов удовлетворяют описанной ниже схеме.

Механизм унифицированной работы с речевыми синтезаторами

Идея унифицированного вызова речевых синтезаторов заключается в том, чтобы перенаправлять речевую информацию от всех программ источников не напрямую в синтезатор, а в некоторое промежуточное программное обеспечение для предварительной обработки. Такой подход даёт возможность модифицировать порядок вызова синтезаторов и распространить изменения на все источники речи в системе. Также это позволяет исключить наложение звука при одновременном воспроизведении от разных программ. В ALT Linux вывод речи выполняет речевой сервер VoiceMan. Также для этих задач может применяться Speech Dispatcher. Любые идеи о том, как можно интегрировать Speech Dispatcher в описываемую схему приветствуются. На текущий момент эта разработка собрана и помещена в репозитарий. Пользователь может её установить и работать с ней, но все конфигурационные операции необходимо выполнять вручную. Описание внутреннего устройства VoiceMan можно прочитать в документе с описанием архитектуры вывода речи на его основе.

 
Личные инструменты