Úvod
Aktuality
Ze studentské soutěže rovnou do Silicon Valley. Na začátku přitom stálo mluvící auto ze seriálu, říká v rozhovoru Petr Marek, absolvent FEL ČVUT a vývojář konverzační AI

Ze studentské soutěže rovnou do Silicon Valley. Na začátku přitom stálo mluvící auto ze seriálu, říká v rozhovoru Petr Marek, absolvent FEL ČVUT a vývojář konverzační AI

Na FEL ČVUT vystudoval program Otevřená informatika, kde se specializoval na konverzační umělou inteligenci. Jejímu výzkumu se věnoval i v průběhu svého doktorátu, který v roce 2024 úspěšně dokončil. Nyní je dr. Petr Marek šéfem výzkumu umělé inteligence ve start-upu PromethistAI, který se zabývá konverzační umělou inteligencí a vývojem digitálních bytostí. V rozhovoru Petr Marek mimo jiné popisuje, jak se mu s týmem Alquist podařilo zvítězit v prestižní americké soutěži Amazon Alexa Prize, co ho ke konverzační umělé inteligenci přivedlo a proč na přelomu tisíciletí neexistovala mluvící auta.

Jaká byla Vaše cesta na FEL ČVUT?

Na FEL jsem se přihlásil z toho důvodu, že už od střední školy mě to táhlo k počítačům. Vystudoval jsem osmileté gymnázium u nás v Žatci a maličko jsem potom litoval, že jsem nešel na průmyslovku. Na druhou stranu mě ale gymnázium velmi dobře připravilo na matematiku a jazyky, což je také cenné. Když přišel čas vybrat si vysokou školu, zvažoval jsem i FIT ČVUT, Matfyz, ale také ZČU v Plzni, která ze Žatce není úplně daleko. Nakonec mi s rozhodnutím pomohlo to, když k nám na gymnázium přišel student Otevřené informatiky a měl strašně krásnou prezentaci o tom, co se na FEL ČVUT dělá. V tenhle moment jsem si to vlastně zamiloval a řekl jsem si, že to je vysoká škola, kterou chci dělat a která mě bude bavit. A tak jsem na ní šel.

Proč jste se rozhodl pokračovat na doktorát?

S doktorátem to bylo takové plynulé. Díky tomu, že se na FEL hodně dělá výzkum a jsou v něm podporováni i studenti, jsem se dostal do studentského inkubátoru, kde působil Ing. Jan Šedivý, CSc. Ten s námi začal dělat konverzační umělou inteligenci a od něj jsem pak dostal příležitost na doktorát jít. Říkal jsem si, že by byla strašná škoda to alespoň nezkusit a kdyby to nedopadlo, tak se vlastně nic neděje. A nakonec asi i tou mojí pílí a prací, která je na doktorátě maximálně nezbytná, se to povedlo a studium jsem loni dokončil.

Jak na své studium na FEL ČVUT vzpomínáte?

Vzpomínám na něj veskrze v dobrém, ale musím říct, že jsem do toho musel dát velké úsilí. FEL rozhodně není lehká škola, to říkám na rovinu, ale zároveň ta náročnost je skvěle vyvážená tím, co studentům dává a co je naučí. Pro mě to byly naprosto nezbytné poznatky, které do dneška v práci plně využívám. A jsem rád, že jsem se neflákal a naopak tvrdě makal.

Měl jste nějakého oblíbeného vyučujícího?

Myslím, že jsem měl velké štěstí na spoustu skvělých vyučujících. Kdybych měl konkrétně někoho jmenovat, tak by to byl pan docent Petr Habala, který učí diskrétní matematiku a učil mě i derivace a integrály. To byl doopravdy jeden z nejlepších vyučujících, kterého jsem kdy zažil.

Nedávno jste měl na naší fakultě přednášku o umělé inteligenci a digitálních bytostech. Baví Vás přednášet? Neuvažoval jste, že byste na fakultě zůstal jako vyučující?

Přednášení mě veskrze baví, ale asi mě nebaví až tak moc, že bych se mu chtěl věnovat jako své hlavní činnosti. Nejvíce mě baví hlavně ta praxe, kterou teď vykonávám a která je pro mě nesmírně cenná, ale rád se jednou za čas vrátím na univerzitu, kde se můžu podělit o to, co děláme a jak to funguje.

V rámci studia i nyní v pracovním životě se věnujete konverzační umělé inteligenci. Jak jste se právě k tomuto tématu dostal?

Můžu dát kratší odpověď a delší odpověď. Ta kratší by byla, že jsem se přidal do toho studentského inkubátoru k Janu Šedivému, který nás studenty začal učit tu praxi. A jelikož on má velkou zkušenost z oblasti rozpoznávání řeči a konverzačních technologií, tak v určitou chvíli vycítil, že hlasoví asistenti se začínají masivně používat, a viděl v tom příležitost i pro nás studenty, abychom se něco naučili. Díky tomu jsem se vlastně dostal ke konverzační umělé inteligenci.

A ta delší odpověď?

Už od malička mě fascinovaly mluvící počítače a vůbec nějaká komunikace člověka se strojem. Když jsem jako malý pětiletý kluk koukal na seriál Knight Rider, kde má detektiv mluvící auto, tak si přesně pamatuju, jak jsem se ptal: “Mami, proč my taky nemáme mluvící auto? Vždyť to by bylo skvělý!” A mamka místo toho, aby mi odpověděla, že taková technologie ještě neexistuje, mi řekla, že by to prostě bylo moc drahé. A mně to vrtalo hlavou. Myslím si, že mě od té doby život směřoval k mluvícím věcem, až jsem u toho skončil. Tak je to možná osud.

S týmem Alquist jste se několikrát zúčastnil prestižní soutěže Amazon Alexa Prize, kterou jste v roce 2021 dokonce vyhráli. Jak soutěž probíhala?

Soutěž Amazon Alexa Prize probíhala každoročně od roku 2017 do roku 2022 s malou přestávkou v roce 2020. Náš tým Alquist se zúčastnil všech pěti ročníků. Začalo to vlastně trochu kuriózně tak, že jsem s naším týmem jedno odpoledne seděl v tom studentském inkubátoru, přišel za námi Honza Šedivý a jako ostřílený matador povídal: “Kluci, Amazon vyhlásil studentskou soutěž na téma konverzační umělé inteligence, tak se tam přihlaste.” Pomyslel jsem si, že nemáme šanci se do té soutěže vůbec dostat, vždyť je určená pro špičkové americké univerzity, které si tam vybere Amazon. Ale rozkaz byl rozkaz, a tak jsme se teda s kluky přihlásili. Prošli jsme výběrovým řízením a návrh projektu, který jsme chtěli v rámci soutěže zrealizovat, jsme napsali asi tak dobře, že nás do soutěže opravdu vzali.

Byl jsem hodně překvapený, ale tím začala naprosto senzační jízda, kdy se nakonec ukázalo, že špičkové americké univerzity jsou na tom velmi podobně jako my. Na soutěžním projektu jsme pracovali v různých pauzách mezi přednáškami, po večerech, ale i o víkendech a snažili jsme se něco zbastlit, hlavně aby to fungovalo. Zadání bylo vytvořit konverzační umělou inteligenci, která si bude s běžným Američanem povídat až 20 minut třeba o filmech, o hudbě a dalších tématech. V průběhu vývoje pak Amazon jednotlivé soutěžní modely konverzační AI pouštěl ke koncovým zákazníkům, kteří si je mohli u sebe v obýváku jako Alexu vyzkoušet. Od nich jsme pak dostávali zpětnou vazbu, což bylo neskutečně cenné, protože jsme mohli velice rychle iterovat a zkoušet, co funguje a co nefunguje.

V prvním ročníku soutěže se nám podařilo umístit se na 2. místě, stejně jako v druhém ročníku. Během třetího ročníku byl covid, takže to bylo trochu složitější, úplně se nám to nepovedlo a skončili jsme na 3. místě. Chuť jsme si ale spravili ve čtvrtém ročníku, který se nám podařilo vyhrát. V pátém ročníku pak soutěž prošla nějakými změnami, ale i tak se nám podařilo umístit na předních pozicích.

V průběhu studia jste byl na stáži v USA. Můžete ji trochu přiblížit?

V roce 2019 jsem se dostal na stáž do Amazonu v Silicon Valley v Kalifornii. Byl jsem součástí týmu, který tehdy vyvíjel umělou inteligenci do jejich hlasové asistentky Alexy. Možnost stáže jsem získal hlavně díky soutěži Amazon Alexa Prize a musím říct, že ta stáž byla fantastická zkušenost. Všem bych doporučil, ať se na nějakou stáž zkusí alespoň přihlásit. Možná to vyjde, možná ne, ale mně to strašně moc otevřelo obzory. Už jen to, že jsem si mohl vyzkoušet žít chvíli v zahraničí, bylo skvělé, ale také jsem pracoval ve velké nadnárodní společnosti a měl možnost přičichnout k jejich špičkovému výzkumu.

V USA stáže často fungují tak, že když jsou s vámi spokojení, tak vám nabídnou buď rovnou práci, nebo možnost další rok stáž opět absolvovat. Já jsem na stáži strávil jedno léto, od června do září, a poté mi nabídli v ní pokračovat v dalším roce. Byl rok 2020, kdy přišel covid, takže jsem musel zůstat v ČR a byl jsem jedním z prvních stážistů Amazonu, který stáž dělal vzdáleně přes oceán. I to pro mě ale byla cenná zkušenost, protože mezi mnou a mým týmem byl osmihodinový časový posun a já jsem najednou viděl, že spolupráce funguje i přes několik časových pásem. Stáž mi pomohla také v rámci doktorátu, jelikož jsem musel mít nějakou zahraniční zkušenost, což se díky téhle stáži povedlo, a také tam vznikl jeden z mých nejdůležitějších vědeckých článků.

Vnímal jste nějaký rozdíl mezi tím, jak se dělá výzkum v USA a jak tady v České republice?

V Americe hodně tlačí na to, aby byl výzkum aplikovaný. Tam se doopravdy výzkum nedělá proto, aby se odprezentoval na konferenci, ale aby pak vyústil v nějaký produkt, něco vylepšil, nebo někde šetřil peníze. Takový tlak na praktičnost je podle mě asi největší rozdíl mezi výzkumem v USA a u nás. Jinak co se týče znalostí a schopností, tak čeští vědci jsou na srovnatelné úrovni s Američany, takže se opravdu nemusíme cítit, že bychom na něco neměli.

Co Vás na vývoji konverzační AI nejvíce baví?

Že to není nějaká věc zavřená v serverovně, ale že s ní lidé doopravdy mluví a komunikují. Líbí se mi, že technologii, kterou vytvářím, pak používá koncový zákazník. Řekl bych, že v dnešní době je konverzační AI nejdokonalejší demonstrace inteligence strojů. Kdybych dělal počítačové vidění nebo nějaké rozhodovací algoritmy, tak to do určité míry umí i všemožní živočichové – něco vidí a na základě toho plánují. Ale jenom lidé jsou schopni přirozené komunikace, takže to si myslím, že je to správné měřítko pro umělou inteligenci. Až dokáže přirozeně komunikovat, tak pak můžeme tvrdit, že už se doopravdy dostává na úroveň lidské inteligence. A to je to, co mě na konverzační umělé inteligenci strašně baví.

Co jsou podle Vás největší výzvy, kterým teď vývoj umělé inteligence čelí?

Rozhodně její využití se zlými úmysly. Na jednu stranu možná dokážeme generovat skvělé fotografie a velice přirozený hlas, ale když se tyto dvě věci zkombinují s úmyslem někoho ošálit, tak to pak může vytvářet určité nebezpečí, na které v dnešní době ještě nejsme úplně připravení. Teď když se na internetu objeví video, jak třeba někdo skočil fantastický trik na lyžích, tak se předpokládá, že se to doopravdy stalo, že ten člověk existuje a takhle fantasticky skákat na lyžích opravdu umí. Myslím ale, že v budoucnosti hodně otupíme, jelikož takových vygenerovaných videí najednou vzniknou tisíce. I kdyby to pak byl reálný člověk, který stovky hodin trénoval, lidé si pak stejně řeknou, že to je pravděpodobně vygenerované video a nebudou tomu věřit.

V současnosti je pořád nejlepší způsob, jak poznat, jestli je něco pravé nebo vygenerované umělou inteligencí, používat selský rozum. To je za mne v tuto chvíli nejlepší obrana proti manipulaci. Do budoucna je určitě příležitost vytvořit něco jako certifikáty důvěryhodnosti, ale abych řekl pravdu, příliš se v tom nevyznám.

Existuje nějaký mýtus o AI, který Vás rozčiluje?

Není to sice úplně mýtus, ale jestli mi něco dokáže rozvařit krev v žilách, tak je to bezhlavé použití umělé inteligence na jakýkoliv problém, protože ona se to přece naučí. To je hodně naivní přístup a přece jenom je potřeba do fungování AI trochu vidět a vědět, jak umělá inteligence funguje, jaký problém bude řešit a jakým způsobem ji nasadíme. Nestačí jen čistý fakt, že AI je skvělá a naučí se to. To v praxi bohužel často nefunguje.

Ve volném čase prý vyvíjíte vlastní hry. Jak jste se k tomuto koníčku dostal a jaká je Vaše nejoblíbenější vlastní hra?

Abych se přiznal, už dlouho jsem žádnou hru nevytvořil. Přece jenom když přijdu z práce, kde celý den programuji, tak začít večer zase programovat už by na mě bylo moc. Hry jsem ale kdysi aktivně vyvíjel a rozhodně nejvíce pyšný jsem na tu, které se říká Zeroes, což je takový matematický hlavolam. Jde tam o to správně přiřadit matematické operace na puntíky s čísly a zkombinovat je tak, aby na všech puntících vyšly nuly. S touto hrou jsem vlastně získal i ocenění na konferenci o výzkumu vlivu počítačových her v Barceloně, kde byla tato hra vybraná jako nejlepší studentská hra prezentovaná na konferenci.

Když tedy celý den v práci programujete a další programování pro Vás není ideální forma odreagování, jak relaxujete?

Relaxuji zaprvé sportem; rád běhám, začal jsem běhat takové ty amatérské závody na pět, deset kilometrů a podobně a pak rád chodím na boulder. A zadruhé hodně rád čtu, a to doopravdy různé žánry – od klasických románů až po populárně naučnou literaturu o meteorologii nebo vědě kolem vaření.

Jakou radu byste dal současným studentům FEL ČVUT?

Buďte pracovití a dřete. Já si myslím, že vysokou školu nedokončují nutně lidé, kteří jsou jen fantasticky chytří, i když to je určitě výhoda. Je ale také maximálně nutné se té škole věnovat, být pracovitý a mít výdrž. Nesoustřeďte se ale také jen na školu. Zkuste si najít i výzkumnou skupinu, nebo běžte do nějaké firmy, kde se dostanete do praxe a uvidíte, jak to funguje v realitě. Nechoďte ale zase do firem, kde vás nechají jen programovat běžné databáze nebo opravovat bugy či dělat jinou rutinní práci. Zkuste si najít něco, kde se budete učit nové věci a kde budete pracovat na těch nejšpičkovějších technologiích, protože to vás bude doopravdy posouvat dopředu.

Autor fotografií: Petr Neugebauer, FEL ČVUT