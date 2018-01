Snaha docílit toho, aby nějaký stroj napodobil lidský hlas, existuje již od konce 18. století. Tehdy se objevily úplně první takzvané syntetizéry lidské řeči. Šlo přirozeně o mechanicky pracující zařízení, jejichž vrcholem se stal Kempelenův „mluvící stroj“. Ten však nemluvil sám, ale pouze moduloval lidský hlas v aktuálním čase a tedy člověk do něj musel mluvit.

V roce 1922 se objevilo první elektronické zařízení, o dalších 17 let později přišel stroj VODER -1, který jako první dokázal syntetizovat souvislou lidskou řeč. Až do konce šedesátých let pracovaly syntetizéry řeči na analogovém principu. První digitální systém přišel v roce 1968. Digitalizace přinesla nejen další zlepšení systému, ale také zmenšení rozměrů celého zařízení. Ke skutečnému rozmachu ale došlo až na začátku 80. let. Jen pro zajímavost, první syntetizér lidské řeči v Československu vznikl v roce 1964.

Jak to vlastně pracuje? Syntetizér lidské řeči je v principu poměrně složité zařízení, jehož hlubší pochopení vyžaduje znalost elektrotechniky a elektroniky. Velmi zjednodušeně řečeno se využívá spojovací (konkatenační) metody syntézy řeči. Základem je jednak zdroj buzení, který simuluje hlasivky, a dále hlasový filtr pro simulaci hlasového traktu. Umělá řeč vzniká tak, že se spojují jednotlivé úseky řeči v jeden celek. U syntetizéru se mluví o takzvaných základních fonémech, což je nejmenší jednotka zvukové řeči, která má v daném jazyce rozlišovací funkci, a dále difonech. Difony jsou části řeči vzniklé ze dvou konkrétních sousedících fonémů.

