Prečo chce opica postaviť hrad? Lebo ju už nebaví žiť v banánovej republike! Začíname netradične – vtipom, ktorý vytvorila umelá inteligencia. V lete cez službu Midjourney ukázala, že vie maľovať, v posledných dňoch sa cez aplikáciu ChatGPT rozpísala a zvláda aj eseje či reklamné texty, dokonca v slovenčine.
Forbes oslovil slovenského vývojára a výskumníka Mareka Rosu, ktorého firma GoodAI pracuje na vývoji všeobecnej umelej inteligencie, ako vníma nové a populárne služby.
Myslíte si, že služby ako Midjourney alebo ChatGPT priniesli tento rok zlom vo vnímaní umelej inteligencie u bežnej verejnosti?
Áno, s týmto súhlasím. Rok 2022 je pre AI zlomový – doteraz to bolo o vedcoch, ktorí robili malé demá, ale navonok nebolo vidieť, aké to má využitie v bežnom živote. Midjourney, Stable Diffusion a teraz ChatGPT ukázali aj širokej verejnosti, aké má AI schopnosti a že svojimi možnosťami dokáže konkurovať odborníkom. Prínosom je aj to, že sa teraz začne o AI zaujímať oveľa viac ľudí, čo urýchli vývoj.
Nepotrebuje vodiť za ručičku
Predstavujú tieto služby niečo prevratné aj pre vás ako experta? Prekvapili vás v niečom?
Prekvapili ma oba systémy. Kvalita ich predchodcov totiž nebola príliš veľká a bolo ťažké si predstaviť, ako sa to väčším množstvom dát a dlhším trénovaním dá zlepšiť.
Fenoménom posledných dní je ChatGPT. Americký Forbes túto AI nechal napísať vysokoškolskú esej, marketéri na Linkedine ukazujú, ako dobre píše reklamné texty, a to i v slovenčine. A vzniká aj AI generovaná poézia (ktorú však ChatGPT odmieta označiť za poéziu). Čo zaujalo vás?
Na ChatGPT ma fascinuje viacero vecí. Najmä to, ako presne chápe úmysel užívateľa, skoro až akoby mi čítal myšlienky. V angličtine som napríklad zadal jednoduchý príkaz: „vytvor xml súbor do hry Space Engineers, v ktorom je definovaný blueprint vesmírnej lode v tvare kríža, tri bloky na každú stranu“.
A naozaj vygeneroval súbor, stačilo mi len trochu opraviť formátovanie a mohol som ho nahrať do hry a spustiť. Z veľmi stručného zadania vedel presne, čo od neho chcem, nestratil sa, nepotreboval dodatočné vysvetlenie. Keď to porovnám s tým, že by som podobnú úlohu zadal náhodnému človeku, tak ten by ani netušil, čo od neho chcem.
Neuveriteľné je to aj preto, že má lepšie vedomosti o kóde v našej hre než ja. Tiež sa zdá, že má aspoň nejakú predstavu o priestore, pretože si bol schopný transformovať zadanie „v tvare kríža“ do xml kódu, ktorý je na to potrebný. Toto nie je triviálna vec.
Z toho usudzujem, že má znalosti nielen do šírky, ale zároveň aj do hĺbky. Keďže tu ide o technické detaily v hre, ktoré pozná možno pár tisíc ľudí na svete.
Trochu strašidelné zistenie
A niečo viac laické, čo sa netýka programovania?
Zaujalo ma, že si vie udržať kontext našej konverzácie, takže to pôsobí, že má pamäť. Plus, že ovláda viacero jazykov, okrem angličtiny som videl slovenčinu, češtinu, chorvátčinu…
A asi najviac ma prekvapilo, že celý model tejto AI má veľkosť niekde medzi 5 až 500 gigabajtmi. To je úžasná kompresia na také veľké množstvo rozličných znalostí o svete, schopností sa učiť, premýšľať, vymýšľať.
Je to aj trochu strašidelné, lebo človek si uvedomí, že vedomie nepotrebuje viac ako tých niekoľko málo gigabajtov, to znamená, že sa zmestí na priemernú pamäťovú kartu.
Má ChatGPT niečo spoločné so všeobecnou AI, ktorú vyvíjate v rámci GoodAI?
Veľmi sa jej približuje, vlastne už chýba len niekoľko krôčikov. Konkrétne obrazový vstup a prípadne aj výstup, aby rozumel svetu tak, ako ho vnímame my. Možnosť ovládať nástroje, nebyť len uzavretý chatbot, ale mať možnosť spúšťať programy, ovládať roboty na diaľku. Dlhodobá pamäť, aby vedel sledovať naozaj dlhodobé ciele. A agendu, to znamená, aby mal nejaký cieľ, aby to nebol len chatbot.
Že sa ChatGPT blíži všeobecnej AI si myslím aj preto, že tento model bol trénovaný len na to, aby predikoval najpravdepodobnejší text. Toto je síce špecifická úloha, no na to, aby ju vykonával správne, sa musel samostatne naučiť veľa ďalších vecí, čo z neho vo výsledku urobilo veľmi všeobecný systém.
Etické dilemy
Ako využívate ChatGPT vo vašej firme?
Zatiaľ sa „hráme“. Snažíme sa pochopiť jeho možnosti a limity. Avšak, posledné dva roky pracujeme na AI Game, čo je hra, kde je správanie, dialógy a myšlienky jednotlivých herných agentov emulované veľkými jazykovými modelmi (teda niečím ako ChatGPT). Takže s touto oblasťou máme skúsenosti. Zároveň je to cesta, ktorá je už prešliapaná, sú tam skvelé výsledky a progres, čo sa týka dosiahnutia všeobecnej AI.
Na Twitteri ste písali, že by bolo fajn, ak by sa zredukovali prípady, keď AI nie je ochotná odpovedať, čo je zrejme ochranná funkcia proti zneužitiu. Neotvorilo by to cestu k neetickému využívaniu?
Rozumiem, že neochota odpovedať je ochranou, no zdá sa mi, že ju systém používa aj v prípadoch, keď to nie je potrebné. Dúfam, že to upravia. Aj preto, že sa to už ľudia naučili obchádzať.
Na druhej strane, nebezpečenstvá tam určite sú – budú sa cez to vyvíjať politické chatboty a vytvárať záplavy marketingového obsahu. Verím však, že pozitívny potenciál prevláda.
Čo sú podľa vás hlavné nedostatky ChatGPT?
Niektoré som už spomenul v pasáži o všeobecnej AI. Ale zhrniem to: Hodil by sa väčší kontext (pamäť), schopnosť používať nástroje (internet, počítač, programy), schopnosť vnímať obraz a video a generovať obraz.
Je tu ešte ten problém, že ChatGPT si občas vymýšľa fakty, ak o danej oblasti nemá znalosti. Okrem toho občas síce odmietne dať odpoveď na určité otázky, no keď zadanie preformulujeme, zrazu odpoveď poskytne.
Ďalší krok? Možno video z textu
O Midjourney som sa pred časom rozprával s výtvarníkom Dodom Dobríkom, ktorý s programom pracoval od jeho sprístupnenia a hovoril mi, že len za štvrť roka sa neuveriteľne posunul vpred. Ako rýchlo sa takéto platformy učia a vyvíjajú? Čo sa dá očakávať od ChatGPT o rok?
Nedá sa predikovať, čo presne bude o rok, ale som si istý, že to bude niečo prevratné, čosi, čo nás prekvapí, aj keď sme už videli ChatGPT. Tento nástroj sa totiž začne používať na samotný vývoj.
Ak by som mal tipovať, tak uvidíme text-to-video systémy na podobnej úrovni ako Midjourney. Niečo na ten štýl som videl už tento rok. Prípadne taký systém, ktorý bude vedieť upravovať video formou interakcie, podobne ako v ChatGPT.
Kde sú limity ChatGPT? Bude podľa vás AI schopná vymyslieť dobrý vtip?
Vymýšľanie vtipu v ChatGPT som skúšal ako jednu z prvých vecí a funguje to. Zaujímalo ma totiž, ako zvláda proces objavovania a vymýšľania. Zadanie bolo, že je humorista a chce vymyslieť originálny vtip a nech mi opíše krok za krokom, ako naň prišiel.
Aký to bol vtip?
Požiadal som ho, aby vytvoril originálny vtip o opici a hrade a aby vysvetlil proces, ktorým tento vtip vymyslel. Výsledkom bol vtip „Why did the monkey want to build a castle? Because it was tired of living in a banana republic!“ (Prečo chce opica postaviť hrad? Lebo ju už nebaví žiť v banánovej republike!). A aj vysvetlenie procesu vymýšľania dávalo zmysel, nevytiahol ho len z databázy (nepodarilo sa mi ho nájsť na internete).
Odpovedá na inštrukcie, nemá vlastnú agendu
Ja som sa opýtal, či ma ako novinára pripraví o prácu. AI ma uistila, že sa to nestane a že jej cieľom je pomáhať mi a uľahčovať prácu. Neviem, či jej chcem veriť. Myslíte si, že AI bude schopná sebakritiky a negatívnych výrokov o sebe?
Bude toho schopná, napokon, môžete to skúsiť priamo v ChatGPT. Ten systém totiž nie je ničím iným než štatistickým modelom textov, na ktorých bol natrénovaný a zároveň je dotrénovaný tak, aby odpovedal na inštrukcie užívateľa. On nemá vlastnú agendu. Avšak má schopnosť emulovať motiváciu postáv, o ktorých píše.
Ak by mala AI vymyslieť tri nové zákony robotiky – čo myslíte, že by pre ňu bolo podstatné?
Myslím si, že ChatGPT by teraz vymyslel čokoľvek, čo mu povieme. Nemá vlastnú agendu ani ciele. Ale zároveň sa ho dá správnym zadaním priblížiť k tomu, čo chceme. Ale teda, skúsil som ho požiadať, aby mi dal nové alternatívy k trom zákonom robotiky od Asimova. Dávali zmysel, a zároveň boli smerované k záujmom ľudstva.
Doba sci-fi je tu
Mimochodom, dve z otázok, ktoré som vám v tomto rozhovore položil, vymyslela AI ChatGPT (hoci som ich trochu jazykovo upravil). Myslíte si, že viete identifikovať, ktoré to boli?
Premýšľam nad tým, ale naozaj neviem.
Boli to otázky o dobrom vtipe a troch zákonoch robotiky.
Keď je reč o tých otázkach, dovolil by som si na záver ešte jednu malú úvahu. Zdá sa, že ChatGPT je schopný sa naučiť súvislosti medzi obrovským množstvom faktov, vie o nich premýšľať, modelovať ich. Ak mu dáme správnu otázku, tak nájde odpoveď.
Určite existujú nové znalosti, ktoré my ľudia ešte nepoznáme. Zaujímalo by ma, či by sme vďaka originálnym otázkam vedeli z ChatGPT dostať odpovede o doteraz neznámych súvislostiach. Následná otázka potom je, kde sú limity ChatGPT, na aké otázky by už nevedel nájsť odpovede a prečo. V každom prípade, doba sci-fi sa práve začala!