SpaceLib

Новости Главная Введение Программы Загрузка Карта сайта

 

Exo. (Эхо)

   Exo - синтезатор речи Эхо . Он с помощью голосовых движков умеет озвучивать двуязычные тексты. Для  работы программе необходимы голосовые "движки" и  Microsoft SAPI версии 5.1 . В XP уже изначально есть "средний" синтезатор английской речи, а вот бесплатного сносного русского нет. Ищите в сети "RealSpeak - Katerina" и лекарство - самый стабильный и надежный синтезатор речи. Есть еще один "шедевр" французской кухни со знаком минус, это ELAN Speech Cube V4.2 голос "Николай". Оба движка используют примерно одинаковые технологии синтеза, по этому качество синтезируемой речи одинаково. Но ELAN Speech Cube  очень не стабилен. "Никола" без словарей чаще ошибается в постановке ударения в словах, чем "Катерина". Кроме того, если "Катерину" продолжают развивать, то ELAN Speech Cube похоже свою русскоязычную часть (nicolai16.dat ) нет. Со времен Digalo размер  nicola***.dat практически не изменился. Да если будете использовать "Катерину" прочтите следующее:

Настройки "по умолчанию" голосового движка ScanSoftKaterina_Full_22kHz заставляют Катю говорить ОЧЕНЬ медленно, создавая впечатление голоса обкурившейся наркоманки или хронической алкаголички.
Для лечения этого недостатка достаточно внести изменения в параметры этого голоса в реестре Windows. Для этого достаточно запустить прилагаемый файл реестр "Katerina_speed.reg" и подтвердить внесение информации в реестр. Все изменения будут сделаны автоматически.
ВНИМАНИЕ!
Запускайте файл "Katerina_speed.reg" ТОЛЬКО В ТОМ СЛУЧАЕ, если Катерина УЖЕ УСТАНОВЛЕНА!
Если по каким либо причинам Вы захотите вернуть все как было - запустите "UNDO_Katerina_speed.reg". (Скачать)
 

  Exo  поддерживает технологию "перетаскивания" текста. Для этого щелкните на иконку с изображением листа документа. Появится полупрозрачное окно, которое умеет принимать текст. Теперь перейдите на приложение с понравившимся текстом отметьте его мышкой и перетащите на окно с "прикольным говорящим котом".

 Перетаскивайте столько раз, сколько захотите, весь текст запоминается. Когда "положите мышку на котика" , он проснется и можете закрывать это окно. Текст появится в основном окне и будет готов для синтеза.

 

   Основное окно тоже может принимать текст. Однако окно с котиком сделано "поплавком" и всегда должно быть поверх всех окон.
   По умолчанию основное окно может содержать только плоский текст. Если вы желаете, уберите галочку у PlainText и программа сможет отображать файлы формата rtf.
   
Чтением чисел теперь вы можете  управлять. Пока, программа может их читать только на русском или на английском. В дальнейшем добавлю анализ контекста.
     Теперь вы можете  управлять чтением текста используя XML тэги. Однако в этом случае вы сами должны разметить весь текст, т.е. вставить переключение между языками и т.д. и т.п. Подробнее об использовании XML тэгов вы можете прочесть здесь (SAPI XML TTS для разработчиков прикладных программ.). Нажав кнопку "Обр.Текста" попадете в новое экспериментальное окно. Оно поможет вам вручную сделать замены. Например XX  на 20 и т.п. Поэкспериментировать с XML тэгами.

 

 При записи в файл  текст рекомендую делить на фрагменты. Это улучшит навигацию при использовании флеш плеера. Как и обещал ранее, теперь можно выбирать:   тип кодирования,  величину битрейта  и алгоритмы создания потока,  при конвертации в mp3.

 Дадим некоторые пояснения. При выборе частоты дискретизации от 8000 кГц до 24000 кГц поток будет MPEG2, а от 32000кГц  до 48000 кГц уже MPEG1. В нашем случае всегда выбирайте Моно, Стерео не дает ни каких преимуществ. Режимы кодирования возможен, как с постоянным битрейтом - CBR,  усредненным битрейтом_- ABR, так и переменным  битрейтом - VBR. У кодека Lame существуют предустановки. Смысл их понятен из названия: LQP_VOICE_QUALITY, LQP_NORMAL_QUALITY, LQP_LOW_QUALITY, LQP_HIGH_QUALITY, LQP_VOICE_QUALITY, LQP_VERYHIGH_QUALITY, LQP_STANDARD, LQP_FAST_STANDARD, LQP_EXTREME, LQP_FAST_EXTREME, LQP_INSANE,LQP_ABR, LQP_CBR,LQP_MEDIUM, LQP_FAST_MEDIUM. Новые предустановки: LQP_PHONE, LQP_SW, LQP_AM, LQP_FM, LQP_VOICE, LQP_RADIO, LQP_TAPE, LQP_HIFI, LQP_CD, LQP_STUDIO. Выбрав любую из предустановок кодек сам позаботится о настройках. Будьте внимательны, не все старые флеш плееры поддерживают переменный битрейт, многие сотовые телефоны не позволяют выбрать битрейт выше определенного значения. Экспериментируйте! Параметры "Качество потока с переменным битрейтом" и "Выбор алгоритма качества" определяю какие алгоритмы кодирования использовать: более медленные , но более качественные или побыстрее но с качеством кодирования похуже.
   Немного английского  юмора.  :)
 Основная задача этой программы - дать работу моему флеш - плееру:)) Т.е. читать такие вещи, которых в виде аудио-книг не бывает. Т.к. использую эту программу постоянно, то поддерживать и дальше развивать буду.
        Exo   написана  по мотивам чтения статей Brian Long (www.blong.com) и "одного дня слушания стонов создателя MP3Book2005 , как он сильно есть хочет". В общем ничего существенного. Исходники прилагаются. И помните, Exo   хранится  у меня в папке с названием  "test_2_voice" :) .

Страница загрузки...

 

 

 

Новости Главная

Введение

Программы

Загрузка Карта сайта
Hosted by uCoz