Newsletter

Týdenní přehled nejdůležitějších zpráv
do vaší e-mailové schránky

Newsletter
Přihlásit se k odběru

Vyvíjí umělou inteligenci, která porozumí lidské řeči. Jan Černocký pracuje pro Facebook i DARPA

Vyvíjí umělou inteligenci, která porozumí lidské řeči. Jan Černocký pracuje pro Facebook i DARPA

Když se řekne analýza řeči, odpověď je Brno. Konkrétně brněnská řečová skupina docenta Jana Černockého na Fakultě informačních technologií VUT. Právě před jejími dveřmi totiž stojí ve frontě Facebook, americké vládní agentury DARPA a IARPA, světová call centra nebo česká policie. „V tom, co děláme, jsme jedni z nejlepších na světě,“ tvrdí vedoucí Ústavu počítačové grafiky a multimédií Jan Černocký. „Ale za tím je spousta let tvrdé práce a pořádná dávka štěstí,“ dodává. Zveřejňujeme on-line další text z prvního čísla magazínu InfoLab, který připravila redakce INFO.CZ.

„To, co děláme, má k vyřešení ještě daleko,“ říká na úvod Černocký. „Mnoho lidí si myslí, že už aplikace na přepis řeči do textu existuje, a diví se, na co zde potřebujeme desítky výzkumníků a serverů,“ dodává. Tak jednoduché to samozřejmě není. Dneska již takový software na trhu je — pokud na něj hovoříte, tak on vaši řeč rozpozná a dokáže s ní dále pracovat.

„Jenže jenom v ideálních podmínkách. Často ale chcete tento program přenést do jiného prostředí, na které nebyl trénovaný. Například místo čisté americké angličtiny chcete najednou rozpoznávat jazyk zulu. Anebo převádět a analyzovat záznamy z pětivteřinových „štěků“ do vysílačky na bojišti. A tam už se začínají systémy, které jsou k dispozici na trhu, rozpadat. A právě tady začíná naše práce,“ říká Černocký. Umělá inteligence, kterou jeho skupina vyvinula, dokáže rozpoznávat jazyk za ztížených podmínek. Zjistí, zda hovoří konkrétní člověk, nebo dokáže převést řeč do textu a s ním dále pracovat.

Brňák, na kterého se stojí fronta
„Pokud budeme dobří, podaří se nám sem přilákat šikovné lidi z celého světa a pro výzkumníka na VUT už konečně přestane platit ta trochu nudná charakteristika – běloch, muž, Čech,“ řekl během svého docentského projevu v roce 2003 Černocký. Po téměř patnácti letech si může tento úkol – alespoň na svém ústavu – s klidem označit jako: „Mise splněna.“

Prestižních projektů, na kterých se Černockého ústav na fakultě informatiky VUT podílel, je celá řada. Brněnští výzkumníci se společností Raytheon BBN spolupracovali například na projektu RATS, podporovaném americkou agenturou ministerstva obrany DARPA. Ta požadovala, aby aplikace dokázala rozpoznávat řeč, konkrétního řečníka či klíčová slova ve ztížených bojových podmínkách — například z amatérských vysílaček. „Brněnští řečaři“ pak spolupracovali i s další americkou vládní agenturou IARPA, konkrétně na programu Babel zaměřeném na rozpoznávání jakéhokoliv lidského jazyka; nyní spolupracují vývojovým centrem umělé inteligence Facebooku FAIR. Je však i mnoho dalších menších projektů, nezřídka z bezpečnostní či zpravodajské oblasti.

Přísně tajné!

Právě tam je spolupráce se zadavateli již ustálená. „Základní scénář je vždy velmi podobný — přijde za námi někdo z této komunity a řekne, hele, potřebuju rozpoznávat určitá data z nějakého kanálu. My mu řekneme, ok, tak nám ale ty data dej, ať máme jejich vzorek. Ne, nedám. Jsou tajná, odpovídá. Tak nám dej alespoň nějakou jejich část, ať můžeme aspoň testovat, trváme na svém. Ne nedám, opakuje se objednatel. Tak nám alespoň řekni, jak to zhruba zní, rezignujeme nakonec,“ popisuje vyjednávání při zadávání projektů Černocký. Výzkumný tým následně obdrží alespoň nějaké specifikace. Například aby naučili program analyzovat řeč na určité frekvenci, rušenou určitým typem radiové komunikace. „My se pak zavřeme do laboratoře, kde se snažíme nasimulovat trénovací data blízká těm cílovým, která jsme ale nikdy neslyšeli,“ popisuje překážky výzkumných projektů docent.

S daty je podle Černockého většinou problém, ostatně jako i u většiny jiných aplikací strojového učení. Na internetu je jich sice ke stažení mnoho, ale ne vždy jsou vhodná. Pro analýzu telefonních hovorů se například nedají použít uživatelská videa ze serveru YouTube, navíc při strojovém učení většinou platí jednoduchá úměra — čím více dat na začátku, tím lepší výstup. „Proto nás vždycky dojímá, když přijdeme na konferenci a lidi z Googlu tam prezentují výsledky systému natrénovaného například na třiceti tisících hodinách přepsaných dat. To všichni skřípeme zubama,“ směje se Černocký.

Brněnští „řečaři“ ale nedostatek vstupních dat pro svůj software řeší po svém. „Buď se dostupná data z YouTube stejně stáhnou a ohnou tak, aby zněla, jak potřebujeme, nebo například procházíme archivy rozhlasových stanic, kam volají lidé. To jsou potom pro telefonní aplikace krásné vstupy. Nějaká další data se pak dají nakoupit nebo vytvořit,“ vypočítává možnosti vedoucí výzkumné řečové skupiny.

S dostatkem dat přichází na řadu jejich aplikace do konkrétních modelů. „Máme tu základní schéma jakéhokoliv strojového učení. Začínáme sběrem dat, pak ta data musíme popsat a vymyslet parametry. 
Pak už jen zbývá nadefinovat modely a dořešit, jak tyto modely natrénovat. Nakonec se pomodlíme a celé to spustíme. Výsledky ale nejsou nikdy tak dobré, jak chceme, takže se můžeme vrátit do libovolného z předchozích bodů a jet znova,“ popisuje proces vývoje umělé inteligence na analýzu řeči docent VUT.

Pozor. Váš hovor bude nahráván

Tento postup například výzkumníci použili při vývoji projektu BISON, který se zaměřuje na datovou analýzu v call centrech. Kontaktní call centra jsou totiž malý paradox — ač jsou největším civilním producentem řeči, fungují i jako černá skříňka — nikdo pořádně neví, co se během hovorů děje. „Jistě, je tam vždy nějaký supervizor, který má pod sebou třeba dvacet operátorů a jejich hovory poslouchá. Ovšem on dokáže zaznamenat jen mizivé procento z nich. Takže například v 98 procentech hovorů se něco děje, ale nikdo neví co,“ vypočítává Černocký. Vývoj softwaru BISON se proto zaměřuje právě na analýzu těchto hovorů. „Jenom z informace, jak dlouho hovořil zákazník a jak dlouho prodejce, se dá odvodit spousta věcí,“ doplňuje docent.

Kromě call center pracuje Ústav počítačové grafiky a multimédií i s českými a zahraničními zpravodajskými a bezpečnostními složkami.
„Je zajímá mnoho našich technologií, například odposlechy telefonních hovorů nebo prostorové odposlechy v místnostech. Ale třeba i to, zda jejich agent může na základě analýzy hlasu zjistit, že osoba před ním je skutečně ta, za níž se vydává,“ vysvětluje Černocký, ale do přesných detailů zabíhat nehodlá. „My řešíme čistě technologii, její konkrétní přizpůsobení a aplikace už je na institucích, které je využívají. Na co konkrétně ji využívají, se jich neptám a ptát nebudu,“ naznačuje docent.

Komisař Moulin je mimo

Podle něj je policejní práce u veřejnosti do značné míry značně zidealizovaná. „Člověk si tu jejich práci občas představuje tak, že si jako komisař Moulin jezdí na motorce po Paříži a zatýkají padouchy. Realita je úplně jiná. I proto jsme si nedávno nechali zpracovat průzkum, pomohl nám v tom i Interpol, a vyšlo nám, že detektivové na analýze nahrávek stráví až 70 procent svého času. A to jsou přece strašná čísla,“ vysvětluje Černocký.

Realita je podle výzkumu taková, že policisté sedí se sluchátky na uších, mají před sebou desítky hodin záznamu policejních odposlechů a snaží se najít, kdy někdo pro jejich případ řekne něco podstatného. „Oni potřebují najít půl minuty, kdy se kriminálníci domlouvají třeba na předání drog, a místo toho musejí celé hodiny poslouchat všechny ty manželky, milenky a babičky… To je šílené,“ tvrdí Černocký. Umělá inteligence z Brna proto umožňuje detektivům výrazně zkrátit čas, po který musí v nahrávkách hledat. „Netvrdíme, že tato naše technologie je perfektní, ale i když tomu policistovi náš software na 50 hodinách záznamu ukáže deset či dvacet míst, na která by se měl zaměřit, je to pro něj obrovská úspora času,“ tvrdí brněnský docent. A o úsporu času jde u využití umělé inteligence při analýze řeči především — ať již v aplikaci pro bezpečnostní složky, nebo při uplatnění pro call centra a vojenské využití.

V tom je i jedna z hlavních výhod umělé inteligence — při analýze velkých objemů dat je schopnější podat výstupy levněji, rychleji a často lépe než člověk, který se tak může věnovat podstatnějším záležitostem.

Že by umělá inteligence mohla za to, že operátoři v call centrech přijdou o práci, si ale Černocký nemyslí. „Kontaktní centra tu budou ještě dlouho, ti operátoři jen díky umělé inteligenci budou dělat svou práci lépe,“ uzavírá docent Černocký.

InfoLab

 

Většinu velkých měst získalo ANO, neovládlo ale Prahu. Významně ztratila ČSSD

Hnutí ANO získalo v letošních komunálních volbách nejvíce velkých měst. Ztratilo ale Prahu, kde vyhrála ODS před Piráty, ANO tam skončilo páté. V Brně, Ostravě a řadě dalších měst však zvítězilo. Významné ztráty zaznamenala sociální demokracie. V celé republice pak tradičně nejvíce zastupitelských křesel získala nejrůznější místní sdružení nezávislých kandidátů. Volební účast se pohybovala mírně nad 47 procenty, což je zhruba o tři procentní body víc než v roce 2014. Vyplývá to z údajů na volebním serveru.

Občanští demokraté sice v Praze vyhráli, ale mohou i tak skončit v opozici. O koalici chtějí totiž další subjekty, jež v hlavním městě uspěly - hnutí Praha Sobě a Spojené síly pro Prahu (TOP 09, STAN a KDU-ČSL) - jednat s Piráty. Do pražského zastupitelstva se poprvé od roku 1990 nedostanou zástupci ČSSD a KSČM. Sociální demokraté nebudou poprvé od roku 1990 ani v zastupitelstvech některých dalších měst, kde dosud měli vliv na chod radnic. Platí to například pro Hradec Králové, Ústí nad Labem a Zlín.

ODS, která v Praze vyhrála komunální volby, získala v 65členném zastupitelstvu 14 mandátů. Druzí Piráti mají 13 mandátů stejně jako třetí Praha Sobě a čtvrtá koalice TOP 09 a STAN. Hnutí ANO, jež mělo v minulém období primátorku, v Praze skončilo na pátém místě. Bude mít 12 křesel.

Volby

V Brně vyhrálo hnutí ANO s 23,03 procenta voličů a v pětapadesátičlenném zastupitelstvu získalo 18 mandátů. Na druhém místě skončila ODS s podporou Svobodných s výsledkem 18,55 procenta, což znamená zisk 14 mandátů. Primátor a lídr ANO Petr Vokřál jednal už s jedničkou ODS Markétou Vaňkovou. Ani jeden spolupráci nevyloučil, ale ani ji nepotvrdil.

V Ostravě vyhrálo ANO s velkým náskokem. Získalo 32,72 procenta hlasů a 21 mandátů v zastupitelstvu, které má 55 členů. Na druhém místě skončilo hnutí Ostravak, volilo ho 11,49 procenta lidí a má sedm mandátů. Ostravský primátor a lídr vítězného hnutí ANO Tomáš Macura už před volbami tvrdil, že by uvítal pokračování nynější koalice s hnutím Ostravak, ODS a lidovci. Dnes ČTK řekl, že to platí.

ANO zvítězilo ve valné většině krajských měst, na prvním místě skončilo také v Plzni, Olomouci, Jihlavě, Hradci Králové, Karlových Varech, Ústí nad Labem, Pardubicích, Českých Budějovicích a Zlíně. V Liberci skončilo ANO druhé, vyhráli tam Starostové pro Liberecký kraj.

Link

Z dalších statutárních měst zvítězila například v Karviné a ve Frýdku-Místku ČSSD. V Třinci vyhrálo sdružení Osobnosti pro Třinec, v Kladně Volba pro Kladno a v Mostě hnutí ProMOST. Občanští demokraté zvítězili v Jablonci nad Nisou, Mladé Boleslavi a Teplicích. ANO vyhrálo v Chomutově, Přerově, Prostějově, Havířově, Děčíně a Opavě.

Drahoš a Čunek se můžou smát, o Senát zápolí ODS s ANO. Rath s Paroubkem propadli>>>

Premiér a předseda ANO Andrej Babiš označil výsledky v krajských a okresních městech za úspěch. ANO podle něj mění Česko k lepšímu. Pražský výsledek předseda ANO a premiér považuje za důsledek toho, jaké bylo působení zástupců hnutí v hlavním městě v uplynulých čtyřech letech. Neočekává, že by výsledek voleb ovlivnil fungování koaliční menšinové vlády ANO a ČSSD.

Podle předsedy ODS Petra Fialy občanští demokraté ve volbách jasně posílili a ukazuje se, že strana jde krok po kroku správným směrem. V příštích volbách do Poslanecké sněmovny by podle něj měla ODS bojovat o směřování Česka proti "levicovému hnutí ANO". Babiš předtím při hodnocení voleb levicovou orientaci svého hnutí odmítl a Fialu kvůli podobným vyjádřením kritizoval.

Link

Předseda ČSSD Jan Hamáček bere výsledek voleb jako signál, že se sociální demokracie už odrazila ode dna, na které dopadla v loňských sněmovních volbách. Úspěchy se dostavily tam, kde je strana konsolidovaná, řekl. Vyzdvihl výsledky v Karviné, Frýdku-Místku či Náchodě, naopak pro velká města chce hledat nová témata, za vhodné považuje dostupné bydlení.

Volby se podle komisí obešly bez větších problémů. V Ústeckém kraji ale policie přijala několik podnětů kvůli podezření z možného pokusu o ovlivnění voleb, všemi se zabývá. Kriminalisté zasahovali ve volebních místnostech v Ústí nad Labem a Bílině na Teplicku, podrobnosti ale zatím policie sdělovat nebude.

Sto třicet mega v hajzlu a Prahu nemáme. Komentář čtěte zde>>>

Po volbách už padají hlavy. Rezignovat se chystá místopředseda ČSSD Foldyna>>>

-1