0:00
0:00
Astrounat Brázda
Odvaha nejen číst
Rozhovory12. 5. 2024

Nečekali jsme, že se umělá inteligence naučí rozumět emocím

S expertem na AI Stanislavem Fortem o místě, kde je v počítači uložen koncept pro lásku, o okamžiku, kdy se rozumové schopnosti stroje přiblížily lidským, a o tom, co si s tím vším počít

Stanislav Fort
Autor: Milan Bureš

Kam dospěly umělé mozky v porovnání s lidskými – nebo třeba s mozkem ježka? A je takové srovnání vůbec fér, když mozky živých tvorů vytvářela evoluce podle úplně jiného klíče? Odpovědi, které nabízí Stanislav Fort, by ještě před deseti lety zněly jako z poněkud odvážné sci-fi, dnes ale popisují realitu. Expert českého původu pracoval – a pracuje – pro ty nejslavnější firmy v oblasti AI. Na začátku rozhovoru, který probíhal v rámci festivalu Academia Film Olomouc, zároveň zdůrazňuje, že jeho odpovědi nereprezentují ani názory Google DeepMind, jeho současného zaměstnavatele, ani těch předchozích.

Použil jste dnes nebo v minulých dnech umělou inteligenci? Jak vám ulehčila život?

Využívám ji v rámci svojí práce víceméně každý den, třeba jako asistenta při programování. Pomáhá mi tak například s návrhem počítačového kódu nebo s odstraňováním chyb z něj. Dnes jsem tímto způsobem s umělou inteligencí spolupracoval asi hodinu nebo dvě. 

Chatbotu klademe otázky jako nějakému orákulu, navíc písemně. Nastoupí časem všudypřítomní hlasoví asistenti, s nimiž se bude člověk bavit na běžné úrovni?

Myslím, že doba, kdy je chatbot dominantním modelem pro kontakt s umělou inteligencí, opravdu bude relativně krátká. Ale povídat si s AI nahlas můžete už dnes. Já si s ní povídám v aplikaci, kde pomocí bezdrátových sluchátek komunikuji s ChatGPT. Třeba se někde procházím a současně probírám s umělou inteligencí matematiku nebo něco, co mě zrovna napadlo. A na konci model požádám, ať mi celý rozhovor shrne i s odkazy, abych ho mohl v budoucnu použít. Není to úplně bezprostřední komunikace a jsou tam jisté malé prodlevy. Ale model přemýšlí víceméně perfektně, takže mi AI pomáhá jako nějaký kamarád, kolega nebo asistent. Samozřejmě v budoucnu ty systémy budou ještě lepší.

Věnoval jste se právě i vývoji jazykových modelů. Když se s umělou inteligencí propojujete v rámci svojí práce, o jaký druh výzkumu či programování jde?

Snažím se pochopit, jak fungují hluboké neuronové sítě (jde o softwarovou strukturu, která napodobuje činnost mozku a velmi dobře se učí z dat – díky tréninku se naučí třeba rozpoznat na obrázcích kočku; hluboké neuronové sítě jsou základem těch druhů umělé inteligence, které v poslední době prodělaly rychlý rozvoj – pozn. aut.). Jde o to porozumět jim do té míry, do které rozumíme třeba fyzice nebo jiným přírodním vědám. Dnes již umíme vytvářet extrémně silné systémy umělé inteligence, ale naše pochopení toho, jak reálně fungují, je velice limitované. Což je bezprecedentní stav, ve kterém jsme nebyli, když jsme stavěli třeba parní stroj.

V jakém smyslu?

Tehdejší znalosti termodynamiky a statistické fyziky stavbu parního stroje předbíhaly, i když ne o moc. Dnes umíme vytvořit inteligentní systémy chytré podobně jako člověk, třeba generativní model GPT-4 (je základem populárního chatbota – pozn. aut.), který umí řešit natolik komplexní otázky, že bychom jej před deseti lety okamžitě označili za obecnou umělou inteligenci (všestranná umělá inteligence, která je na úrovni lidské nebo ji předčí – pozn. aut.). Sice úplně přesně chápeme, jak takový systém funguje na té nejnižší úrovni, jak se v něm třeba násobí matice, ale na vyšší, abstraktní úrovni, na úrovni přemýšlení, emocí, mu nerozumíme skoro vůbec. Nevíme, kde je v něm lokalizovaný třeba nějaký koncept pro lásku nebo pro želvu, a je možné, že takové lokalizace ani neexistují.

Od mikrosvěta k makrosvětu

Jak vypadá velký jazykový model fyzicky? Máme si představit obrovskou halu plnou počítačů?

Fyzická infrastruktura je skutečně obrovská. V porovnání s lidským mozkem jsou tyhle věci extrémně energeticky náročné a fungují opravdu hodně jinak. Představte si serverovou farmu v obrovské budově, která je podobná třeba skladu Amazonu někde na okraji města a je plná výpočetních jednotek – grafických karet, na kterých systém běží. Každá z nich má příkon několika set wattů a sama provádí množství operací, které by před dvaceti lety odpovídalo největšímu superpočítači světa. Těchto grafických karet využívá velký jazykový model během tréninku až desítky tisíc.

To je neuvěřitelný, nepředstavitelně rychlý pokrok.

Množství základních výpočetních operací, které je potřeba k tréninku těchto modelů, je dnes stejné nebo větší než Avogadrovo číslo, což je číslo o 23 až 24 nulách, téměř bilion bilionů. Je to číslo, které vyjadřuje počet molekul v asi 20 litrech vzduchu a představuje takovou pomyslnou hranici mezi makroskopickým a mikroskopickým pozorováním přírody, přechod mezi makrosvětem a mikrosvětem. Připadá mi poetické, že inteligence stroje se začala projevovat podobně jako lidská v okamžiku, kdy jsme v počtu výpočetních operací přešli z mikroskopických množství do makroskopických.

Předplaťte si Respekt a nepřicházejte o cenné informace.

Online přístup ke všem článkům a archivu

Články i v audioverzi a mobilní aplikaci
Možnost odemknout články pro blízké
od 150 Kč/měsíc