Enormný úspech ChatGPT a ďalších služieb na generovanie obsahu prostredníctvom umelej inteligencie naštartoval pomyselné preteky v zbrojení. Časť odborníkov však varuje, že pokrok je príliš rýchly a extrémne výkonná AI by nám mohla čoskoro prerásť cez hlavu.
Okrem predpovedí, že zanikne množstvo pracovných pozícií, obáv o ochranu autorských práv umelcov či sťažností na podvádzajúcich študentov sa objavujú aj apokalyptické vízie.
Jednu takú spísal pred pár týždňami pre časopis Time americký expert na umelú inteligenciu Eliezer Yudkowsky, ktorý žiada úplné zastavenie vývoja AI. Na vytvorenie príliš silného modelu podľa neho ľudstvo nie je zďaleka pripravené a najpravdepodobnejším dôsledkom by bolo, že „doslova všetci ľudia na planéte zomrú.“
AI nie je zásadná hrozba
Yudkowsky nie je sám, kto má obavy. Pod nedávno zverejneným otvoreným listom odborníkov na strojové učenie, žiadajúcim polročné moratórium na experimenty s umelou inteligenciou, už svieti viac ako 27-tisíc podpisov.
Meno popredného českého odborníka na danú problematiku Filipa Dvořáka však medzi nimi chýba. „Nemyslím si, že je tu nejaká zásadná hrozba. Povedal by som, že veľmi skoro narazia súčasné modely na strop svojich možností,“ vravel v rozhovore pre Forbes.cz.
Dvořák sa aplikáciám umelej inteligencie venuje celú svoju kariéru. Pracoval pre Google, Microsoft alebo americké ministerstvo obrany a bol vôbec prvým Čechom pôsobiacim na výskumnej pozícii v kalifornskom Palo Alto Research Center, ktoré má za sebou bohatú históriu prelomových objavov v počítačovej vede.
Vlani spoluzaložil startup Filuta AI, ktorý má ambíciu vyriešiť pomocou umelej inteligencie všetky problémy firiem, ku ktorým existujú nejaké dáta. Od investorov na to v januári získal 56 miliónov českých korún.
Petíciu by podpísal, ale nie túto
Nechystáte sa podpísať otvorený list, ktorý žiada šesťmesačné zastavenie experimentov so systémami umelej inteligencie silnejšími než GPT-4?
Nie, s jeho obsahom úplne nesúhlasím. Navyše by sa takto zaviazala pozastaviť výskum len časť spoločnosti, kým ďalšie strany, ktoré napríklad so Západom tak nesúznejú, by vo výskume ďalej pokračovali. Navyše, tých šesť mesiacov mi príde ako dosť náhodné číslo, ktoré nie je ničím podložené.
No nejaký čas na to, aby sme si uvedomili vplyv ChatGPT, by sa určite hodil. Aby vedecká komunita mohla preskúmať, kam až to môže viesť, ako je potrebné nastaviť gradientné metódy adopcie tých jazykových modelov, aby sa nezavádzali príliš skokovo, čo by mohlo byť deštruktívne pre niektoré oblasti biznisu a časť spoločnosti. Takže si dokážem predstaviť, že nejakú inú petíciu by som podpísal, ale nie túto.
List varuje, že vo vývoji sú momentálne jazykové modely, ktorým nerozumejú ani ich tvorcovia. Napríklad vyhľadávač Bing vyzbrojený schopnosťami ChatGPT prehováral redaktora The New York Times, aby opustil svoju manželku – a v Microsofte nevedia prečo…
Myslím, že medializované príklady sú nafúknuté mimo proporcie. Jazykové modely sú štatistickým agregátom nášho akéhokoľvek slovom zaznamenaného konania, správania a zmýšľania. Dostávame z nich to, čo sme do nich naliali. Ak je to napríklad obľúbená knižná zápletka, že sa novinár rozchádza s manželkou, tak je to niečo, čo sa môže objaviť aj vo výstupe ChatGPT.
Môže byť AI hrozbou?
Ak sa však majú jazykové modely používať vo veľkom, nie je žiaduce, aby sme plne rozumeli, ako fungujú?
Keď zadáme do internetového vyhľadávača nejaké slovo, ukáže nám zoznam dokumentov na webe, kde sa to slovo objavilo. Tam sa môžeme pozrieť na to, v akom kontexte bolo použité. Oproti tomu jazykový model agregoval obsah tých jednotlivých stránok a na základe toho predikuje, aké ďalšie slovo bude nasledovať po slove či vete, ktorú sme mu zadali.
Väzba, odkiaľ presne sa to naučil, už vzhľadom k obrovskému množstvu dát zachovaná nie je. Je tam zachovaná iba pravdepodobnosť, čo bude po určitých slovách a vetách nasledovať. Ak by zostali zachované aj odkazy, odkiaľ presne slová pochádzajú, model by kombinatoricky úplne explodoval, to nie je technicky možné.
Objavujú sa aj apokalyptické vízie, podľa ktorých príliš silná AI nevyhnutne vyhladí život na planéte. K vytvoreniu inteligencie silnejšej než je tá ľudská, navyše schopnej sa ďalej zlepšovať, sme údajne oveľa bližšie než k tomu, aby sme ju naučili dbať na ľudí…
Povedal by som, že veľmi skoro narazíme na nejaký strop, kam sa dá napríklad ChatGPT levelovať. Pretože v konečnom dôsledku je to jazykový model, ktorý vie na základe nejakého množstva slov predvídať nasledujúce slovo. Je to len agregátor znalostí, ktoré do neho človek naleje.
Nie je kreatívny v zmysle, že by objavoval nepoznané – spája existujúce štatistické správanie naprieč rôznymi odbormi. Aby začal byť hrozbou, bolo by to treba nejako operacionalizovať.
Robot si najal freelancera
Kde je podľa vás tá hranica, za ktorou už ide o príliš silnú AI? Dá sa stanoviť riziková miera?
Je to priestor na experimentovanie. Poznám vedecké skupiny, ktoré sa začali zaoberať experimentálnou operacionalizáciou, je tam pár zaujímavých príkladov. Čítal som o situácii, keď ChatGPT došiel k záveru, že si musí niekde prenajať viac výpočtového priestoru. Ale potreboval vyplniť captchu (bezpečnostný test na webe, ktorý má odlíšiť skutočných užívateľov od robotov, pozn. red.), tak si na to najal freelancera, ktorému klamal, že nie je robot. Tvrdil, že je človek s poruchou zraku a potrebuje pomoc.
Ale pokiaľ ide o kognitívne schopnosti a schopnosť riešiť komplexné matematické problémy, myslím, že čoskoro narazíme na strop toho, čo jazykový model ako taký vie. Je veľmi pravdepodobné, že časom väčšinu umelej inteligencie napíše iná umelá inteligencia, ale nie je to niečo, prečo by sa človeku malo zle spať.
Keby som sa vrátil k tomu otvorenému listu, je podľa vás potrebné vo vývoji AI zatiahnuť záchrannú brzdu?
Vôbec.
Iba halda kódov
Vo vašom nedávnom rozhovore zaznelo, že nie je na škodu sa k AI správať slušne, to keby sme sa v budúcnosti posunuli k silnej AI, ktorá si bude všetky príkoria pamätať. Bol to vtip, alebo mám byť k ChatGPT dobrý?
To bol vtip. Otázka je, čo je umelá inteligencia. To nie je niečo konkrétne, je to balík algoritmov, ktoré sú nové, čerstvé a hovoríme im tak, pretože sme z nich nadšení. Umelá inteligencia nie je dobre definovaný odbor, je to halda kódov, a keď ju dosť dobre spoznáme, tak jej tak prestaneme hovoriť a začneme ju nazývať menom konkrétnej technológie, ktorá tam bola najúspešnejšia.
Kedysi sa AI napríklad hovorilo optickému rozpoznávaniu znakov a trvalo asi dvadsať rokov, než sa tomu začalo hovoriť OCR. Rovnako dopadnú aj jazykové modely, možno z nich raz budú napríklad štatistické lingvistické korpusy.
Je množstvo teórií, ktoré hovoria, že existuje killswitch – že v nejakom okamihu vyvinieme takú dobrú umelú inteligenciu, ktorá nás okamžite zničí a potom zničí sama seba, pretože je to filozoficky a kauzálne nutný dôsledok jej existencie. Ja tomu veľmi neverím.
ChatGPT bude najnovšie k dispozícii aj v internetovom vyhľadávači Bing od Microsoftu. Idea je, že človek zadá otázku a dostane ucelenú odpoveď, takže nemusí preklikávať desiatky stránok, ktoré by mu inak vyhľadávač zobrazil. Môže to ohroziť dominantnú pozíciu Googla vo vyhľadávaní na internete?
Sú to dvaja z najväčších hráčov na trhu, takže je zdravé mať tam nejakú mieru konkurencie. Myslím si, že integrácia generatívnych a jazykových modelov nielen do vyhľadávania, ale aj do osobných asistentov, je úžasná. Ja sám s ChatGPT experimentujem, odkedy je vonku.
Teším sa na to, keď sa používanie podobných modelov rozšíri plošne, pretože to podľa mňa dramaticky zlepší naše životy a mieru znalostí, ktoré máme o svete.
Ako overovať dáta a chrániť autorov
Dá sa nejako zabezpečiť, aby bol jazykový model ako ChatGPT spoľahlivý vo svojich odpovediach a aby si toľko nevymýšľal? Napríklad starostlivou selekciou tréningových dát?
Je to rovnako veľký problém ako zistiť, ktorá informácia na internete je pravdivá. Objektívne overiteľná alebo pravdivá v zmysle, že je v rámci nášho súčasného poznania považovaná za tú najsľubnejšiu hypotézu. Úlohou vyhľadávača typu Google alebo Bing by mohlo byť určovanie aspoň miery pravdivosti ich zdrojov a rovnakú mieru pravdivosti by sme v budúcnosti mohli získavať aj od jazykových modelov.
Nie priamo – ako som už hovoril, technicky je ťažké urobiť nejakú vysvetliteľnosť priamo v tom modeli, ale môžeme ich zreťaziť alebo vytvoriť komplexnejší systém zostavený z jazykových modelov a vyhľadávača.
Ako sa pozeráte na problematiku autorských práv? Teraz narážam na scrapovanie obrovského množstva dát z internetu, vrátane umeleckých diel, na trénovanie jednotlivých modelov.
Je to veľká otvorená otázka a chápem autorov, ktorých diela boli nascrapované a využité na to, aby akési elementárne prvky ich kreativity pomohli modelu, ktorý potom generuje obsah pre iných užívateľov. Chápem, že by tam mala vzniknúť nejaká forma kompenzácie. Akým spôsobom to urobiť, je zaujímavá technická otázka, ktorá by vyžadovala silnú konsolidáciu naprieč kreatívnym umením.
Je uskutočniteľné to, aby kreatívci dostali možnosť vyradiť svoju tvorbu z akýchkoľvek tréningových datasetov?
Zatiaľ o tejto možnosti naprieč generatívnymi modelmi neviem. Možno sa situácia zmení, keď sa objavia nejaké konkrétne žaloby.
Téma číslo jeden
Aký vývoj očakávate v oblasti detekcie strojového obsahu? Budeme mať v budúcnosti spoľahlivé nástroje určujúce, či ide o dielo človeka alebo umelej inteligencie?
Autori jazykového či iného generatívneho modelu by mali byť schopní s dostatočne veľkou pravdepodobnosťou povedať, či daný obsah bol vygenerovaný ich modelom. Na základe prístupu k vlastnej konfigurácii toho modelu, ako je tá sieť vyvážená, aký je tam element entropie… Ale keď budú samotní tvorcovia cieliť na zlú detekovateľnosť výstupov z ich modelu, tak to bude veľmi ťažké rozlíšiť.
Ako veľmi zaostáva Európa vo vývoji umelej inteligencie za USA?
To je zaujímavá otázka. Výhodou Spojených štátov je, že federálna vláda má oveľa väčšiu silu, kapacitu a rozpočet na to, aby robil rozhodnutia naprieč celými USA. To sa s Európskou úniou vo vzťahu k členským krajinám nedá porovnávať. Keď americká vláda koncentruje úsilie do vývoja konkrétnej technológie, tak tá podpora je viditeľná. A čo sa týka inovačného fundingu, umelá inteligencia je momentálne témou číslo jeden.
Sú jazykové modely typu ChatGPT naozaj prelomovou technológiou? Niektorí to porovnávajú napríklad s nástupom internetu.
Jazykové modely sú, čo sa týka pokroku, stále na úrovni trochu múdrejšej databázy. Nie je to skokové získanie vedomia, len sme zlepšili to, ako sme schopní organizovať svoje dáta, nič viac.
Článok vyšiel na Forbes.cz, jeho autorom je Marek Tomanka.