Редактирование: Синтез речи
Перейти к навигации
Перейти к поиску
Правка может быть отменена. Пожалуйста, просмотрите сравнение версий ниже, чтобы убедиться, что это нужная вам правка, и запишите страницу ниже, чтобы отменить правку.
Текущая версия | Ваш текст | ||
Строка 9: | Строка 9: | ||
Система преобразования текста в речь (или "движок") состоит из двух частей: передней и задней. Front-end имеет две основные задачи. Во-первых, он преобразует необработанный текст, содержащий символы, такие как цифры и аббревиатуры, в эквивалент выписанных слов. Этот процесс часто называют нормализацией текста, предварительной обработкой или токенизацией. Затем интерфейс присваивает фонетические транскрипции каждому слову, а также делит и помечает текст на просодические единицы, такие как фразы, предложения и предложения. Процесс присвоения фонетических транскрипций словам называется преобразованием текста в фонему или графемы в фонему. Фонетические транскрипции и просодическая информация вместе составляют символическое лингвистическое представление, которое выводится интерфейсом. Back-end - часто называемый синтезатором — затем преобразует символическое лингвистическое представление в звук. В некоторых системах эта часть включает вычисление целевой просодии (контура высоты тона, длительности фонемы), которая затем накладывается на выходную речь. | Система преобразования текста в речь (или "движок") состоит из двух частей: передней и задней. Front-end имеет две основные задачи. Во-первых, он преобразует необработанный текст, содержащий символы, такие как цифры и аббревиатуры, в эквивалент выписанных слов. Этот процесс часто называют нормализацией текста, предварительной обработкой или токенизацией. Затем интерфейс присваивает фонетические транскрипции каждому слову, а также делит и помечает текст на просодические единицы, такие как фразы, предложения и предложения. Процесс присвоения фонетических транскрипций словам называется преобразованием текста в фонему или графемы в фонему. Фонетические транскрипции и просодическая информация вместе составляют символическое лингвистическое представление, которое выводится интерфейсом. Back-end - часто называемый синтезатором — затем преобразует символическое лингвистическое представление в звук. В некоторых системах эта часть включает вычисление целевой просодии (контура высоты тона, длительности фонемы), которая затем накладывается на выходную речь. | ||
[[Файл:TTS System.svg|400px|thumb|left|Обзор типичной системы TTS]] | [[Файл:TTS System.svg.png|400px|thumb|left|Обзор типичной системы TTS]] | ||
==История== | ==История== | ||
Строка 144: | Строка 144: | ||
===AmigaOS=== | ===AmigaOS=== | ||
[[Файл:SoftVoice.svg|300px|thumb|right|оп]] | [[Файл:SoftVoice.svg.png|300px|thumb|right|оп]] | ||
Второй операционной системой с расширенными возможностями синтеза речи была AmigaOS, представленная в 1985 году. Синтез голоса был лицензирован Commodore International от SoftVoice, Inc., которая также разработала оригинальную систему преобразования текста в речь MacinTalk. Он включал полную систему голосовой эмуляции американского английского языка, как с мужскими, так и с женскими голосами и индикаторными маркерами "стресса", ставшую возможной благодаря аудиокомплексу Amiga. Система синтеза была разделена на библиотеку переводчиков, которая преобразовывала неограниченный английский текст в стандартный набор фонетических кодов и устройство рассказчика, реализующее формантную модель генерации речи.. AmigaOS также имел высокоуровневый "Обработчик речи", который позволял пользователям командной строки перенаправлять вывод текста в речь. Синтез речи иногда использовался в сторонних программах, особенно в текстовых процессорах и образовательных программах. Программное обеспечение синтеза оставалось практически неизменным с первого выпуска AmigaOS, и Commodore в конечном итоге удалил поддержку синтеза речи из AmigaOS 2.1 и далее. | Второй операционной системой с расширенными возможностями синтеза речи была AmigaOS, представленная в 1985 году. Синтез голоса был лицензирован Commodore International от SoftVoice, Inc., которая также разработала оригинальную систему преобразования текста в речь MacinTalk. Он включал полную систему голосовой эмуляции американского английского языка, как с мужскими, так и с женскими голосами и индикаторными маркерами "стресса", ставшую возможной благодаря аудиокомплексу Amiga. Система синтеза была разделена на библиотеку переводчиков, которая преобразовывала неограниченный английский текст в стандартный набор фонетических кодов и устройство рассказчика, реализующее формантную модель генерации речи.. AmigaOS также имел высокоуровневый "Обработчик речи", который позволял пользователям командной строки перенаправлять вывод текста в речь. Синтез речи иногда использовался в сторонних программах, особенно в текстовых процессорах и образовательных программах. Программное обеспечение синтеза оставалось практически неизменным с первого выпуска AmigaOS, и Commodore в конечном итоге удалил поддержку синтеза речи из AmigaOS 2.1 и далее. |