Ето какво ми изпрати по пощата човек, който не познавам. Моето скромно мнение е, че тоя човек, както и Златин Георгиев, знаят какво ни трябва и могат да го направят. Остава някой да ги ангажира сериозно - срещу заплащане. (Защото лЕсно нЕма :-) и безплатен обяд също.)
Виктор Любенов, 3 август 2003
Това е едно демо, без претенции за сериозно приложение - просто за идеята :)
Всички математически алгоритми са разписани в сорса "от нула". Не са използвани библиотечни функции, освен sin().
Метода, по който работи синтезатора е добре известен отдавна: линейно прогнозиране (LPC). LPC синтезаторите спадат към така наречените "параметрични синтезатори". При този вид синтез, елементарните части на говора - фонемите (или части от фонеми) се синтезират чрез математически алгоритми по предварително изчислени параметри - в случая LPC коефициенти, основен тон, съотношение тон/шум и амплитуда на възбуждащия сигнал.
Параметричния синтез дава голяма гъвкавост, тъй като можем да променяме параметрите по време на синтеза така, че да получим необходимия вид на фонемата. Например чрез управляване на основния тон и амплитудата, се постига произволна интонация.
Другата важна част в един синтезатор на говор от текст е анализатора на текста. Той трябва да определи интонацията, ударенията, начина на произнасяне на думите (думите не се произнасят така, както се пишат), местата на забързване и забавяне и други.
За съжаление в тази версия, анализиращата текста част е в съвсем елементарен вид. За сега няма включена функция за автоматично поставяне на ударения. Гласните записани с голяма буква се повдигат с няколко херца и се удължават - и това върши работа за демо.
Отделил съм минимален брой фонеми, колкото за демо на алгоритъма, а и интонационните контури са малко измислени.
За получаване на естествено звучащ говор е необходимо да се поработи още доста.
Програмата не записва нищо в Windows Registry или файловата система и няма никаква връзка с Inter/Intra -net.
OS: Windows'98
Хардуер:
Необходимо е да имате инсталирана звукова карта или друго звуково устройство, което поддържа:
- PCM формат (WAV файл)
- честота на дискретизация 22050 Hz
- моно, 16 бита за отчет
- асинхронен режим
Скоростта на процесора и паметта не са критични, но може да се получи "накъсване" на говора ако не достига време в нишката за изчисленията.
Стартиране:
Просто разархивирайте Txt2Spch.exe някъде и го стартирайте. Бутона "Read me" стартира синтезатора.
ВНИМАНИЕ:
Възможни са бъгове.
Не стартирайте програмата, ако имате незаписани данни в други приложения.
ВНИМАНИЕ:
Тази програма е предназначена единствено за демонстрация и не трябва да се използва за други цели, още по-малко да се управлява от друга програма във Windows.
Много бих се радвал на коментари, каквито и да са.
p.s@post.com; p.s@mail.bg
Обратно на предходната страница.
Обратно на заглавната страница.
http://bezmonitor.com (123.dir.bg)