Megérkezett, meg tudtam arról győződni, hogy nem az avatár jött el. Elvileg, technikailag, műszakilag megoldható lenne ma, hogy mi ketten az avatárokon keresztül beszélgessünk egymással? Vagy még nem?
De, abszolút. Az avatár egy digitális megjelenítése egy személynek. Az történik, hogy felvesznek néhány kameraállásból egy-egy videót, nagyjából kétszer 5-8 percet, utána egy jó minőségű mikrofonnal fölveszik a hangot, ez még 10 perc, és 30 perc alatt létrejön egy olyan adatállomány, amit a mesterséges intelligencia feldolgozik. Ebből megtanulja, hogy én hogyam szoktam gesztikulálni, hogyan beszélek, milyen tempóval, mennyire artikulálok. Ebből létrehozza a digitális másomat, de ez már nem egy filmszerű valami, hanem egy digitális modell, aminek ha leírjuk, hogy mi az, amit neki el kell mondani, akkor azt megfelelően gesztikulálva, megfelelően grimaszolva, el fogja mondani. Ha az én avatárom egyik ChatGPT-ként föltesz egy kérdést az ön avatárjának, ezek elbeszélgetnek egymással. Ez nem jövőbeni megoldás, ezt ma is meg lehet oldani. Attól vagyunk még talán távol, hogy az avatár hogyan látszik. Most ez két számítógépet jelentene, vagy két mobilt? Ha kicsit továbbgondoljuk, Gábor Dénes születésének ebben az évben van a 125. évfordulója, ő találta ki annak idején a hologramot. Ha az avatárt nem egy képernyőn személyesítjük meg, hanem valamilyen 3D-s technológiával, akkor ott is ülne egy ilyen avatár, itt is ülne egy avatár és beszélgethetnének egymással arról, amit nekik megtanítottak, amit ismernek. Ha valaki használja, mondjuk, a ChatGPT-t, akkor tudja, eléggé széleskörű párbeszédre ad lehetőséget. Fizikai kapcsolatba nem tudunk kerülni az ilyen avatáron keresztül, de ha egy kicsit továbbgondoljuk, az sem a sci-fi kategória most már, hogy ha két robot teszi ugyanezt, akkor még verekedni is tudnának egymással. De remélhetőleg egyelőre erre azért nem kerül sor.
Mennyire kellene aktuálisan megtanítani az avatárokat vezérlő intelligenciát, hogy tudja, hogy én mit fogok kérdezni, mert én nem tudom, hogy a második kérdés mi lesz, mert az az ön első válaszától függ, és az ön ismeretei pedig valószínűleg az én kérdéseim hatására is strukturálódnak?
Csak annyira, mint amennyire egyébként a ChatGPT-vel beszélgetünk. Fölteszünk egy kérdést, és ő válaszol rá valamit, az én következő kérdésem az az ő válaszától függ. Ez a technológia rendelkezésre áll. Nem kell nagyon sok mindent hozzátenni ehhez, hogy ugyanezt két avatárral megtegyük.
Mi volna az értelme? Hogy ön meg én valami teljesen mást is csinálhatnánk? Én elmehetnék horgászni, ön elmehetne futni, miközben az adást csináljuk?
Tulajdonképpen ilyet is lehet. Én kormánybiztosként hadd lelkesedjem az egész mesterséges intelligenciától. Ha megkérdezzük az embereket, hogy ők mit is gondolnak erről, inkább félnek tőle. Azt javaslom mindenkinek, hogy legyünk ettől nagyon boldogok. A mesterséges intelligenciával egyszerűen új lehetőség adódik a mindennapi életünk gyakorlatilag minden területén, olyan akár, ami soha nem volt. Én ettől nagyon lelkes vagyok. Ezt a lelkesedést megpróbálom átadni annak, aki hallgatja, nézi, amit csinálunk, és ezért úgy gondoltuk, hogy ezt megpróbáljuk egy ide illő eszközzel, az avatárral is megtenni. Megcsináltuk az avatáromat, merthogy úton vagyok, meg tudom írni azt az 5-6-8-10 mondatot, amit elküldünk ennek az avatárnak, és ez az avatár el fogja mondani, és innentől kezdődően ez jó hangulatot teremt ebben az ügyben. Ez volt az indoka az avatárnak. De mondok másik példát, hogy mi is a jelentősége egy avatárnak. Ha egy oktatási anyagot akarok olyan formában elmondani annak, aki az oktatásnak a célja, hogy érdekelje, hogy milyen módon beszél valaki ott, mellette megjelenik egy másik képernyő, vagy egy másik részén a képernyőnek, ugyanez a szöveg leegyszerűsítve, írásban, ábrákkal, akkor tulajdonképpen van jelentősége annak, hogy nem egy személy beszél, aki lehet, hogy kiváló matematikus, kiváló mérnök, vagy olyan, mint én, ne adj Isten, de nem annyira jól beszél, és nem annyira érdekes. Miért ne mondja helyette valaki más, aki ezt érdekesebbé teszi? Itt például a tanulás hatékonyságát tudjuk nagymértékben erősíteni. Konkrét ügyek, amiről most beszélek. Ugyanez igaz akkor is, ha mondjuk neurodiverz – autistának is szoktuk nevezni – gyerekeket tanítunk. Esetükben nagyon nem mindegy, egyébként okosak, csak más módon tanulnak, hogy ki az a valaki, aki az oktatást végrehajtja. Ha egy érdekesebb avatár, egy híresebb személy, akkor ezt nyilván jobban fogják tudni kezelni, mint ha egyébként valaki monoton hangon elmond valamit.
A mesterséges intelligenciával való kommunikációban nagyon fontos a promptolás minősége. Az, hogy hogyan kérdezünk. Minél jobban kérdezünk, annál jobb válaszokat fogunk kapni. De ki tanítja meg az embereket jól kérdezni?
Ez egy új viselkedési tudományág, ahogy egyébként megtanulunk beszélni is. Ha a ChatGPT-vel akarunk kommunikálni, akkor nagyon fontos, hogy mi a kérdés, ő a kérdésre tud válaszolni abból, amit megtanult. Ha a kérdést rosszul tesszük föl, akkor valószínűleg rossz választ fogunk kapni. Ha a kérdés nagyon rossz, akkor az is előfordul, ezt hallucinációnak hívják, a másik oldalon lévő mesterséges intelligencia elkezd olyan dolgokat mondani, ami nem úgy van, de ő akar válaszolni a kérdésre. Ezért nagyon fontos az, hogy nagyon specifikus legyen a kérdés, és nagyon specifikus formában tegyük föl, legyen egyértelmű, amit tudni akarunk, mert akkor nem kalandozik el. Ezt meg kell szokni. Ez ugyanolyan, mint bármilyen másik kommunikáció emberek között is, ha valaki érthetetlenül beszél és érthetetlenül teszi fel a kérdést, akkor valószínűleg érthetetlenebb reakciót kap rá. Itt ugyanez a helyzet.
Mi a kormánybiztos feladata? Milyen feladatot kapott?
2020-ban még innovációs és technológiai miniszter voltam, akkor úgy gondoltuk, hogy a mesterséges intelligencia egy nagyon érdekes, innovatív technológia, ezért került ahhoz a minisztériumhoz a mesterséges intelligenciára vonatkozó stratégia előkészítése. Létrehoztuk a hátterét, ez egy mesterséges intelligencia koalíció, akkor háromszázegynéhány cég, most már ötszáz fölött van a számuk, cégek, egyetemek, kutatóintézetek, állami szervezetek. Elkezdtünk azon gondolkodni, hogy milyen viszonyt is akarunk a mesterséges intelligenciával, ez egy technokratább stratégia lett, hiszen azt láttuk, hogy vannak neurális hálók, meg vannak szuperszámítógépek, tényleg el kéne indítani az adatgazdaságot. Meghatároztuk, hogy mit kell tenni, és egész jól sikerült a stratégia, csak az idő nagyon gyorsan telik. Itt öt év gyakorlatilag az őskort jelenti. Emlékszünk arra, hogy 2020-ban, gegnek szántuk egyébként, az OTP létrehozott egy nagy számítógépes környezetet a magyar nyelv modelljére, akkor én elmentem oda, és föltettem egy maszkot, nem én beszéltem, hanem az akkori ChatGPT-vel, egy korábbi változattal megcsináltattuk a beszédet, amit aztán ott elmondott. Nem avatár volt, de elmondta. Az akkor még nem volt tökéletes, ma ezek tökéletesek. Változik a világ, s ehhez kell tudni alkalmazkodni valamilyen formában. Visszatérve a feladatra, s hogy miért most lett kormánybiztos. Egyszerűen azért, mert a 2020-as alapvetően technológiai technokrata megközelítés ma már nem erről szól. Ez már nem egy érdekes technológia, nem egy innovatív eszköz, amit sok mindenre lehet használni. Tulajdonképpen az életünknek nincs olyan része, ahol ne jelenne meg a mesterséges intelligencia, és innentől kezdődően ezzel a közösségünknek valamilyen viszonyt kell képezni. Miniszterelnök úr ezért kért föl arra, hogy részben a kormányzat, de a gazdaság, a jog vagy az üzlet területén legyen valaki, aki megpróbálja valamennyire koordinálni a tevékenységeket. Fontos tudni, hogy a kormánybiztos nem miniszter, nem rendelkezik azokkal az eszközökkel, azokkal a jogkörökkel, mint egy miniszter, viszont több területnek a tevékenységére ér be a mesterséges intelligencia, ezért több helyen kell neki megnyilvánulni. Egyfajta koordináció, egyfajta kommunikáció. Bizonyos területeken vannak olyan jogkörei a kormánybiztosnak, ahol tevőlegesen feladatot kell ellátnia, de ezt egy minisztériummal együtt látja el. Ilyen terület, például, a szuperszámítógépeké, ott egyértelműen azt mondja az a statútum, amit én kaptam, hogy a szuperszámítógépes kapacitások fejlesztése ennek a kormánybiztosnak a feladata, felügyel bizonyos területeket, meghatároz bizonyos területeket.
Nemzeti, régiós, európai uniós ökoszisztémákat kell fejleszteni, vagy be kell csatlakozni a globális ökoszisztémákba és ott bérelni kell valamit?
Is-is. Magyarország a méreteinél fogva nyilvánvalóan nem azon országok közé fog tartozni, amelyek a legnagyobb szuperszámítógépes kapacitásokkal rendelkeznek, valószínűleg nem is azok közé, amelyek a legkomolyabb matematikai apparátust teszik egy ilyen dolog mögé. De önmagában ez nem baj. Nálunk is a Rényi Kutatóintézet nagyon jó dolgokat csinál a mesterséges intelligencia alapjait képező matematikai objektumokkal kapcsolatosan, mi is fejlesztünk szuperszámítógépes kapacitást, de legnagyobbat a világon. Ahol viszont mindenki egyezően jó tud lenni, és ez nagyon fontos dolog, hogy olyan alkalmazásokat fejlesszünk, ami a mi közösségünknek fontos. Erre mondanék néhány példát, de még az előző gondolatot lezárva, azokat az ügyeket, amelyek már elkészültek és megvannak, nem szabad megismételni. Nyugodtan lehet használni azokat a nagy nyelvi modelleket, amiket sokkal-sokkal több adaton tanítottak föl, mint a magyar nyelvű modellt. Felvetődik a kérdés, miért van szükség akkor magyar nyelvű modellre, azt hiszem, ötöt fejlesztünk most éppen. Azért, mert vannak olyan ügyek, amiket ezek a nagy nyelvi modellek nem kezelnek, mert az ő érdeklődési szintjüket az, hogy Budapesten éppen hol van gyerekorvosi sürgősségi ellátás, nem érinti, ezt nem tudják, kellenek ilyenfajta modellek is. Ezekből a nagy nyelvi modellekből nem mindig a ChatGPT-t használjuk, a mögöttes hatalmas instrumentációból lehet levezetni olyan kisebb nyelvi modelleket, amiket viszont specifikus alkalmazásokra lehet használni. Innentől kezdve a specifikus alkalmazás már nagyon sok minden lehet, ami lokális. A magyar zene, például, az egy olyan terület, amire egy ilyen nyelvi modellt érdemes is használni. Idetartozik a magyar nyelv önmagában is, ennek a specifikumait ezekkel lehet jól kezelni, ezért jó az, hogy az OTP annak idején kifejlesztette azt az egyébként a legnagyobb magyar korpusszal rendelkező elemet, nagy nyelvi modellt, ami most közösségi használatra is elérhető, hiszen ennek egy részét állami támogatással tették. Ezért fontos az, hogy legyenek saját megoldásaink is, de óhatatlanul, ami létezik, azt használni kell, ezeknek a használata egyébként nem bonyolult. Ami megvan, azt meg kell venni, ami meg nincs, azt meg érdemes kifejleszteni, de azok mindig a saját céljainkra történő fejlesztéseket jelentik.
A korpusz az az adatmennyiség, amivel dolgozik a modell?
Meg az, hogy honnét származik ez a mennyiség. A nyelvi modelleket valamin fel kell tudni tanítani. Ez lehet a teljes magyar írásbeliségnek és szóbeliségnek valamilyen leképeződése. Ez nem volt elég arra, hogy például ezt az említett modellt ezen feltanítsuk, ott kellett használni angol, meg azt hiszem, talán egyéb más adatbázisokat is, de óhatatlanul azért a magyar közös, a magyar nyelvnek vannak specifikumai, ami ha megvan, akkor az jó.
Honnan származnak az adatok, amivel a mi nemzeti rendszerünket föl tudjuk tölteni? Automatikusan generálódnak-e az adatok, vagy külön be kell írogatni?
Az adatok generálódnak valahol. Alapvetően, mondjuk, egy bankban, amikor egy ügyintézővel beszélek, azt rögzítik. Ez egy beszélgetés. Ezt a beszélgetést már lehet használni mint tanító algoritmust. Ha fölolvastatom a Széchenyi Könyvtár könyveit, akkor azt is föl lehet tanítani. Erről megoszlanak a vélemények, hogy mi is történik ténylegesen, hogy van-e még elég írásbeliség és szóbeliség a világon ahhoz, hogy ezeket tudjuk használni ilyenfajta modelleknek a tanítására. Elon Musk mondta valamikor egy pár hónappal ezelőtt, hogy elfogytak az adatok.
Mindent elolvastak.
Mindent elolvastunk, mindent fölolvastunk, minden szóbeliséget valahogy összeraktunk, nincs több adatunk. Akkor most mi fog történni? Hogyan lehet akkor ezentúl tanítani a nagy nyelvű modelleket? Azt mondta Elon Musk, hogy akkor úgy tűnik, hogy ezentúl szintetikus adatokat kell használni. Hogy mi a szintetikus adat, és hogy mit jelent ez? Ezek ilyenfajta nyelvi módon legenerálnak újabb helyzeteket. Van egy új kifejezés, ezt Double AI-nak hívják, ez a dupla mesterséges intelligencia. A múlt hét elején voltam Izraelben, és egyik kollégánk írt erről egy cikket. Azt mondja, ez egy olyan konstrukció, hogy fog egy mesterséges intelligenciát, ami problémákat generál, és egy másikat, ami ezeket a problémákat megoldja, és ezek egymással elkezdenek együttműködni. Na, itt megint szintetikus adatok képződnek, az egyik generálta a problémát, a másik a megoldás. Tulajdonképpen egy harmadikat már lehet ezeken az adatokon is akár tanítani. Valószínűleg ez lesz az az irány, ami ki tudja egészíteni a dolgot.
Számít az, hogy egy valódi, létező problémát generál-e, vagy az a lényeg, hogy egy probléma legyen, hogy interakcióba kerüljön?
Nem szükségszerű, hogy létező probléma legyen, egyrészt nem tudjuk, hogy az a probléma mit generál.
Lehet, hogy probléma, csak nem tudtunk róla, hogy probléma?
Vagy nem tudtunk róla, vagy nem most probléma, hanem valamikor probléma volt. Ez mindenképpen egy ügyet kezd el felfejteni, ahogy itt emlegetni szokták, olyan matematikai problémákat, mint a kör négyszögesítése, a háromszög négyszögesítése volt. Ezek olyan ügyek, amik a múltban voltak, aztán van, amire találunk megoldást, lehet, hogy nincs rá, vagy eddig úgy gondoltuk, hogy nincs, ez a kérdés, aztán kiderült, hogy van. Pont a neurális hálóknak az egyik lényegi funkciója az, hogy az adatok között olyan mintákat ismer föl, olyan összefüggéseket ismer föl, amit egyébként mi valószínűleg nem ismernénk föl, hiszen ha fölismernénk, megtehettük volna eddig is. De ő ezt máshogy kezeli, és ebből olyan tudáselemek jelennek meg, amik egyébként eddig nem voltak.
A háromszög négyszögesítésén viszonylag kevés ember szokott elgondolkozni. Vagy sok ember? A mindennapi életünkben ritkán kapom fel a fejem arra, hogy de jó lenne ezt megoldani.
Nem tudom, hogy hányan gondolkoznak el ezen. Eleve a problémát meg kell fogalmazni, hogy mit jelent a háromszög négyszögesítése, tehát hogy a háromszög területével milyen négyszöget lehet a benne lévő alakzatokkal előállítani, ez valószínűleg nem a mindennapi problémáink közé tartozik. Egy érdekes matematikai feladvány, amivel néhány ember foglalkozik, de nyilván vannak másfajta ügyek is, amelyekről a múltban úgy gondoltuk, hogy érdekes, aztán nem tudtuk megoldani, de most lehet, hogy rátérünk erre.
De olyan problémákkal viszont valószínűleg sokakat érdekel, hogy egy adott kórkép diagnózisa hamarabb meglegyen, vagy hogy a szolgáltatót hamarabb érjem el, és a problémámra hamarabb kapjak választ. Ebben benne van az MI?
tt szeretnék visszatérni arra, amit az elején mondtam, hogy szerintem az, hogy ez az eszközrendszer a rendelkezésünkre áll, az egyik legjobb dolog, ami történhetett velünk. Elkezdhetjük sorolni azokat az alkalmazásokat, amiket ön is mondott, egészségügyi alkalmazások, például. Ha egy adott leletet, ez lehet röntgentől kezdődően CT, a leletező orvosnak kell feldolgozni, akkor az ő tudása és képessége határozzák meg azt, hogy észrevesz-e rajta egy olyan elváltozást, ami potenciálisan ahhoz vezethet, hogy valaki onkológiai betegségeket fog majd szerezni. Ha nem veszi észre, akkor eltolódik ennek az észrevételezése. Viszont ha ezt egy mesterséges intelligenciával tesszük, ami sokkal érzékenyebb ezekre, mert látott már ilyet, akkor sokkal gyorsabban kerül ezzel a kórképpel az orvos elé a beteg, sokkal gyorsabban lehet beavatkozni. Ezt egy kicsit még árnyalva, Krausz professzor úr, Nobel-díjasunk, aki egyébként 2019 óta már Magyarországon is folytatja a kutatásait, molekuláris ujjlenyomat-kutatást végez, ez furán hangzó dolog, de tulajdonképpen arról van szó, hogy a vérmintánkban ott van annak a lenyomata, hogy milyen betegségek érhetnek bennünket a jövőben. Ezt úgy érhetjük, hogy a molekuláris szerkezetben, ha van valamifajta szakadás, deviancia, akkor, amikor ezt a vérmintában lévő molekulát gerjesztjük lézerrel, akkor ez rezgésbe jön. Amikor rezeg, kibocsát egy elektromágneses hullámot. Na, ez az, amikor az attoszekundumos felismerésnek jelentősége van. Most ne bonyolítsuk, ez rezeg, valamilyen elektromágneses hullámot kibocsát, és ennek a hullámnak a spektruma, tehát hogy milyen frekvenciatartalmak vannak benne, jellemző arra, hogy milyen sérülés van a molekulában. Az a sérülés pedig, ami a molekulában van, jellemző lehet arra, hogy milyen betegséget fog majd az az adott ember a jövőben elkapni. Ő azt nézi, és ez egy mesterséges intelligencia alkalmazás egyébként, hogy aspektusban lévő anomáliák, eltérések, egyéb mások, milyen betegségre jellemzőek, és ezt már olyan korai fázisban meg tudja mondani, ennek az ellenőrzését végzi ő Magyarországon, hogy az adott beteg, hogyha egyébként így néz ki ez a molekuláris ujjlenyomat, akkor mondjuk cukorbetegséget szerez-e. Ha pedig tudjuk elég korán, hogy az illető hajlamos arra, hogy cukorbeteg lesz, vagy hajlamos arra, hogy valamilyen onkológiai betegsége lesz, azzal szemben már korai fázisban lehet tenni.
Felkészült arra az egészségügyi ellátórendszer, amelynek egyébként sem combos a kapacitása, hogy ha mindenki tudja, hogy jövő év december 2-án nekem nagy valószínűséggel ilyen problémám lesz, akkor…
Ennyire pontosan nem, de ebből diagnosztikai eszköz lesz. Bedugom az ujjam, vesz egy csepp vért, ezt a vércseppet megvilágítjuk lézerrel, egy másik eszközzel elvégezzük a szuperspektrális analízist, utána megnézzük azt, hogy ebben milyen jellemző eltérések vannak, és azt mondjuk, hogy potenciálisan te, mondjuk az elkövetkező öt évben cukorbeteg lehetsz, változtass az életmódodon. Sportolj, étkezz egészségesebben, ne igyál alkoholt. Ez egy diagnosztikai eljárás, amire az egészségügy sokkal felkészültebb, nagyon jó példáink vannak egyébként. Magyarországon nem szokás megdicsérni valakit, ha valami pozitív dolgot tesz, különösen az egészségügyben. A magyar egészségügyi rendszer arra fölkészült, hogy úgynevezett adatalapú ellátást hajtson végre. Van az EESZT nevezetű rendszerünk, ezzel mindenki szembesül, hiszen a gyógyszer receptjét már ott kapja, az orvos oda tölti föl a leleteit. Ez egy nagyon jó adatbázis, mert tízmillió ember adatait egy egységes rendszerben kezeljük. Innentől kezdődően ebből a rendszerből, egyrészt az adott betegre vonatkozóan, adott betegcsoportokra vonatkozóan, sok következtetést le lehet vonni, össze tudom hasonlítani, mondjuk azt, hogyha egyébként ezt a betegcsoportot, ezzel a betegséggel, ilyen gyógyszerrel kezeltem, mi lett ennek a hatása. Innentől kezdődően viszont, hogyha ez megvan, ezt például Peták István csinálja, egy magyar tudós nagyon sikeres ezen a területen, ezek a tapasztalatok alapján – ha tudom, hogy milyen genetikai elváltozása van a betegnek – meg tudom mondani azt, hogy mi az optimális gyógyszerkombináció. Erre a magyar egészségügy abszolút föl van készülve. Amióta nagyobb mértékben végzünk, például, vastagbél-, emlőrákszűréseket, ott egy szükségesség, hogy legyen AI alapú leletező orvos, merthogy egész sor dolgot, mielőtt még a lelettel orvoshoz jutnak, ebből nyilván nincs elég, előtte már van egy előzetes vélemény, de nagymértékben egyszerűsíti a helyzetét. Másik példa, ha valakinek olyan CT-vizsgálatot végeznek, ami egyébként a gerincet is érinti, akkor erre a gépre rá lehet telepíteni egy olyan szoftvert, aminek nem a gerinc képezi a vizsgálata tárgyát, hanem minden más mellette. De ha úgyis elvégezzük a CT-t a gerincre, és ott a gerincen egyébként keresünk mikrorepedéseket, és azt mondjuk, hogy ott van valami, ezt nézzük meg mindenképpen, ezek mind olyan ügyek, amik pont ahhoz vezetnek, hogy sokkal jobb és hatékonyabb lesz a diagnózis, és utána a kezelést is hatékonyabban tudjuk végrehajtani.
Egy aktusból a lehető legtöbb adatot kinyerni?
Abszolút, és nem terheljük a beteget. Ez egy elég értelmezhető folyamat. Van olyan cég, amelyik ezzel foglalkozik, a Semmelweis Egyetemmel együttműködve komplett adatbázist építettek arra, hogyan hogy lehet ezt a fajta vizsgálatot úgy elvégezni, hogy nem kerül semmibe, hiszen ott van, egy plusz szoftver kell rá.
Hol lakik a mesterséges intelligencia? Hol van most? Hol dolgozik, hol kel és fekszik?
Ez egy összetett történet. Gyakorlatilag majdnem mindenhol, ezzel szembesülünk. Ha felhívunk mondjuk egy bankot, és a bankban az ügyintézővel akarnánk beszélni, akkor már nem biztos, hogy a banki ügyintézővel beszélünk, lehet, hogy egy mesterséges intelligenciával beszéljük meg azokat az ügyeket, ami éppen érint bennünket. Ha mondjuk a digitális állampolgárság alkalmazást használjuk, abban bizonyos döntéseket már lehet, hogy egy másfajta algoritmus, lehet, hogy egy mesterséges intelligencia algoritmus hozott. Ha beülünk a modern autónkba és beavatkozik a sávelhagyó asszisztens, akkor abban valószínűleg valamilyen mesterséges intelligencia alapú megoldásunk lesz. Sőt, ha esetleg négyes szintű önvezetésről beszélünk, az az, aminél van még kormány az autóban, de már nem én vezetek, akkor mesterséges intelligenciával szembesülünk. Vagy az előbb említett egészségügyi példák ugyanilyenek, nem biztos, hogy a leletező orvos végezte el a teljes leletezést, nyilván aláírta és meg is nézte, de lehet, hogy a felét már a mesterséges intelligencia tette. Ezekkel ma már ilyen formában szembesülünk.
De fizikailag van lakhelye a mesterséges intelligenciának? Az autómban úgy tudom elképzelni, hogy benne van egy dobozban.
Alapvetően mindig valamilyen digitális eszközön történő megjelenést jelent. Önmagában a mesterséges intelligencia papíron is létezhet, de annak valószínűleg most már kevés előfordulása lehet. Ez valamilyen digitális platformon létezik, egy számítógépen lakik. A mesterséges intelligencia egy számítógépen létező valami. Mi ez a valami? Misztikusnak tűnik, ezt mesterséges neurális hálónak szokták hívni. Ez nem új dolog. Már nyolvcvanegynéhány évvel ezelőtt kitalálódott. Én, azt hiszem, 1993-ban írtam az első olyan cikket, amikor mesterséges neurális hálóval végeztünk járműfedélzeti számítógépen olyanfajta becsléseket, modellezéseket, hogy hogyan is nézhet ki a gumiabroncs karakterisztikája akkor, amikor az ESP-vel be akarok avatkozni. Ez, mint matematikai jelenség, nagyon régóta létező valami. Az, hogy most jelent meg, ennek két indoka van. Az egyik az az, hogy 1992–1993 környékén az adatokhoz való hozzáférés még nem volt feltétlenül olyan, mint ma, illetve nem volt hozzá számítási kapacitásunk. Azt a projektet, amit az előbb említettem, azért hagytuk abba, mert az autó fedélzeti számítógépén nem bírtunk optimálási feladatokat végrehajtani. De ebben lakik a mesterséges intelligencia. Ez egy olyan valami, amiben van egy szorzási művelet, van összeadás, van benne egy súlyozó függvény, meg van benne két eltolás. Nagyjából ezek azok a paraméterek, amikkel egy ilyen neurális hálózat rendelkezik, amikor tanítjuk a neurális hálózatot egy meglévő adathalmazon, akkor tulajdonképpen ezeket a paramétereket változtatjuk nagyon gyorsan, az összest, ebből aztán egy nagy nyelvi modellnél több tízmilliárdos nagyságrendről beszélünk. Ezeket változtatjuk addig, amíg egy optimális illeszkedést a tanító adatok bemenő külön oldalán látunk, és amikor azt mondjuk, hogy na, most megtaláltuk az optimumot, akkor rögzítjük ezeket a paramétereket, és utána már tulajdonképpen valóban csak szorzási meg eltolási, meg egyéb műveleteket kell végrehajtanunk. Ez a mesterséges intelligenciának a lakhelye, ilyen értelemben mindig egy eszközben lakik. Ha leegyszerűsítjük és ránézünk magunkra, mondjuk a pacemakerünk már így működik, a digitális óránk így működik, a telefon mesterséges intelligencia alkalmazásokkal működik, a mosógépeink, a mosogatógépek zseniális területeket jelentenek.
Maradva a közérthető autós példánál, milyen messziről lehet hozzáférni az én autóm sávelhagyás figyelő rendszeréhez? Kap frissítéseket, tehát távolról is hozzá lehet férni.
Bízunk benne, hogy rossz szándékú hozzáférést a rendszer fedélzeti architektúrája nem enged. Ez egyébként nagyon fontos kérdés, hiszen ezek a rendszerek adatalapon működnek. Ha ezeket az adatokat korrumpáljuk, ha ezeket bármilyen módon megváltoztatjuk, akkor ezekkel lehet olyan dolgokat is csinálni, amit nem akarunk, vagy nem a mi szándékunkban áll. A szoftverletöltés nyilvánvalóan nem egy rossz szándékú történet, azzal javítani akarunk valamit, de tulajdonképpen ezekhez nagyon távolról is hozzá lehet férni, hiszen az autó esetében a szerviz le tudja tölteni az adott szoftvert az autóban lévő SIM kártyán keresztül, ha ezzel kapcsolódik a környezetéhez. Itt arra azért nagyon kell figyelni, hogy ne történhessen olyan, ami rossz szándékú beavatkozást jelenthet, leegyszerűsítve egy autonóm autót ne lehessen kívülről arra rávenni, mondjuk, hogy menjen neki egy másik autónak. Vannak ilyen filmek, mint a Fast & Furious.
Persze, tele vannak ilyenekkel a videojátékok, azokból születnek a filmek.
Ezek valós ügyek, a másik oldal, meg a jófiúk, akik ezeket fejlesztik, ők meg azzal foglalkoznak, hogy kívülről ne lehessen meghackelni ezeket a járműveket. Ez egy verseny a rosszfiúk meg a jófiúk között, egyelőre a jófiúk állnak győzelemre.
Amikor mesterséges intelligenciát kell okosítani, fejleszteni, akkor programozókkal kell dolgozni, jogászokkal kell dolgozni, nyelvészekkel kell dolgozni, gazdasági szakemberekkel kell dolgozni?
Inkább az adott területhez értő szakemberek a fontosabbak. A programozók megtették a saját dolgukat, meg folyamatosan teszik, létrehoznak olyan matematikai, számítógépes struktúrákat, amik alkalmasak arra, hogy föltanítsuk őket. De amikor tanítjuk, akkor már az adott területhez értő szakemberek a fontosak. Egy példa: az EESZT alapvetően PDF-fájlokban tartalmazza azokat az információkat, amik a betegről készülnek. Ezek lehetnek strukturáltabbak, például a laborleletek, meg lehetnek nem annyira strukturáltak, például az orvos által írt elemzés, amikor ott ülünk a rendelőben, mi nem értjük, hogy mit mond az orvos, mert részben latinul, részben orvosi szakszavakat használva vázolja a helyzetet, részben nem az egészet mondja el. Szóval ahhoz, hogy egy ilyet tudjunk strukturálni, ilyet tudjunk átalakítani, meg tudjuk tanítani egy neurális hálónak, ahhoz kell egy orvos, aki elmagyarázza, hogy ezt hogyan kell interpretálni. De amikor ez egyszer megtörtént, akkor viszont ez már ilyen értelemben adattá válik. Itt a szakembernek a jelenléte fontos. Ott is fontos a szakember jelenléte, amikor egy mesterséges intelligencia tesz egy javaslatot, végez egy elemzést, és ahhoz kell egy emberi döntés, hogy valóban az a fajta eredmény jött ki, aminek kellett, vagy esetleg belehallucinált valamit az ügybe. Tehát megpróbált válaszolni, és kikerült abból a tanított adattérből, amit ő látott előtte, megpróbál valamit extrapolálni, ezen kívül csinálni. Ott viszont fontos az, hogy legyenek olyan szakemberek, akik értik, hogy mi történik. Persze ezt nem kell túlgondolni, tehát ha a ChatGPT-vel iratok egy adott területre egy fogalmazást, ott mondjuk lehet, hogy én is el tudom dönteni, vagy a szülő el tudja dönteni, hogy amit a gyerek csinált vele, az éppen mit jelent. De ha orvosi leletezésről van szó, ott orvos kell, hogy megnézze azt, hogy igen, amit az MI tumorjelnek vélt felfedezni a képalkotó diagnosztikai leleten, az valóban az-e.
Szokásbeli különbségeket kell kezelni? A fogorvosok állandó példája, hogy Amerikában egy ilyen problémával kihúzzák a fogat, minálunk pedig a fogmegtartó kezeléseken van a hangsúly. A ChatGPT vagy a diagnosztikai szoftver valószínűleg a húzást fogja javasolni.
Azon múlik, hogy mit tanítottak neki. Ha a ChatGPT-t alapvetően egy amerikai adatbázison tanítják, ott lehet, hogy azt fogja mondani, hogy ki kell húzni a fogat, és egyszerűbb beültetni egy másikat. Ha egy magyar fogorvosi tankönyv alapján tanítják, akkor már lehet, hogy azt fogja javasolni, hogy inkább tartsuk meg, próbáljuk megoldani azt, hogy ne kelljen kihúzni a fogat, mert az a jobb. Ez azon múlik, hogy mit tanítottak neki. Ezzel kapcsolatban azért van némi óvatosságra ok, ha például, egy adott történelmi helyzetet megtanítunk egy bizonyos szempontból, egy ország szempontjából, s megtanítjuk egy másik ország szempontjából, lehet a kettő az eltérő. A példa Trianon. Trianonnak a megítélése Magyarországon, a magyar tankönyvekben, feltételezem, hogy nem ugyanaz, mint mondjuk a környező országok valamelyikének a tankönyvében. Itt azért óvatosan kell bánni azzal, hogy melyik alapján tanult valamit. Ugye, ha az adott mesterséges intelligenciát, mondjuk a ChatGPT-t megtanítjuk a magyar tankönyvekre, vagy egy másikat, akkor nyilván a magyar tankönyvekben lévő értelmezést fogja elmondani. Ha olyan kérdést teszek föl, ami abban nem volt benne, akkor azt mondja, hogy bocsánat, erre a kérdésre nem tudok válaszolni, mert a tanító adatbázisom nem tartalmazta ezt. Ez a fair és korrekt viselkedés. Ha meg tartalmazta mind a kettőt, akkor el kell dönteni, hogy amit ő mondott, az jó-e nekem, vagy nem jó. Nekem mind a kettő igaz lehet, mondtuk azt, hogy nem lehet máshogy tekinteni egy történelmi eseményre, de speciel lehet, hogy a magyar érettségin Trianon értelmezésénél nem ugyanazt várják, mint egy másik ország hasonló vizsgáján.
Maradva még mindig a fog példájánál, ilyenkor fel kell tanítani a diagnosztikai javasló szoftvernek a biztosítási környezetet is?
Ez nem orvosi kérdés, hanem biztosítási. A biztosító mit fedez? A magyar biztosító fedezi, mondjuk a fogmegtartó kezelést, az amerikai meg azt mondja, hogyha egyébként nincsen ilyen biztosításod, akkor húzzuk ki ezt a fogat, mert az belekerül, nem tudom, 200 dollárba, ha pedig meg akarod tartani, az ezer dollár, de nem jó a biztosításod. Az is lehet, hogy érzékeli, hogy hol van az illető, Amerikában vagy mondjuk Európában, ezen belül Magyarországon. Ha megvan ez a fajta korreláció, hogy Magyarországon ezt a fogat nem szokták kihúzni, hanem helyette meggyógyítják. akkor viszont azt kell mondani, ha elmész egy fogorvoshoz, hogy Magyarországon ezt a fogat nem húzzák ki, Amerikában kihúznák, az is egy lehetőség.
A Nemzeti Hírközlési és Informatikai Tanáccsal, a Nemzeti Adatvagyon Ügynökséggel és számtalan ilyen szervezettel a mesterséges intelligencia kormánybiztosának mi dolga van? Hogy néz ki ez a rendszer?
A hamarosan megjelenő új stratégia két részt tartalmaz, van egy alapozó pillér része, és van egy, mondjuk azt inkább, alkalmazási vagy példa része. Az alapozó pillér része nagyon sok mindent tartalmaz, ami ahhoz szükséges, hogy egyáltalán meglegyen a megfelelő jogi, műszaki hátterünk ahhoz, hogy egyáltalán gyártani tudjunk mesterséges intelligencia alkalmazásokat. Amikor 2020-ban megcsináltuk az első stratégiát, még nem volt európai uniós szabályozás. Mi is sokat gondolkodtunk rajta, hogy mi a kormánynak, vagy a jogszabályi környezetnek itt a feladata. Amerikában nem szabályozzák a mesterséges intelligenciát, Kínában sem egyébként.
Azért tartanak ott, állítólag, ahol tartanak.
Összetett a kérdés. Az első reakció nyilván ez, hiszen ha mindent lehet, akkor sokkal egyszerűbb. Nyilván Amerikában sem úgy van egyébként, hogy mindent lehet mesterséges intelligenciával, lehet, hogy nincs saját AI-törvény. Angliában sincs, ahol azt mondták, hogy ha valami visszaélés történik egy mesterséges intelligencia alapú rendszerrel, akkor a normál jogrendünknek kell tudni kezelnie ezt valamilyen formában. Az ottani Ptk. egyértelműen előírja, hogy mit jelentenek a személyiségi jogok, hogyha engem egyébként egy drónról lefényképeznek, vagy lefilmeznek, és egyébként ezt egy AI-val feldolgozzák, és ebből lesz valami kép, és az megjelenik az újságban, akkor az ottani Ptk. alapján bepereljük, elmegyünk, aztán megnyerjük a pert.
És egy mesterséges intelligencia jogsértés egy 400 éves, tehénen alapuló jogesetre fog visszaállni?
Akár ez is lehet, az angolok így döntöttek. Az Európai Unió egy kicsit más döntést hozott, de nyilván ennek indoka van, hogy az EU azért egy bonyolultabb szerkezet, mint akár egy egységes adatstruktúrával rendelkező Egyesült Államok vagy Kína. Azt mondta, hogy azért ez nem ennyire egyszerű, hiszen ez a technológia alkalmas arra, hogy különböző rizikószinteken ugyan, de kárt okozzon az embereknek. Négy rizikószintet definiáltak, ennek az első szintje az, ami már Magyarországon is hatályosult, és majd jönni fog a többi is. Én most azt mondanám, hogy ezek nem gátolják a mesterséges intelligencia eredményes alkalmazását. Az, hogy én egy onkológiai leletnek a mesterséges intelligencia alapú értékelését elvégzem, nem gátolja semmilyen formában. Ami tudja ezt gátolni, és ez szintén a jogrendhez tartozik, ez az adatokhoz való hozzáférés. Ez inkább már a GDPR-nak a tartománya. Ha nem férek hozzá azokhoz az adatokhoz, amelyek ahhoz szükségesek, hogy én egy alkalmazást létre tudjak hozni, vagy akár nem egyszerűen férek hozzá, az versenyhátrányt jelent. De ez Amerikában meg Kínában sincs máshogy. Az AI Act, ami egy rendelet európai szinten, törvényt jelent, Magyarországon az elemeinek az installálása most történik, augusztus elejéig létre kell hoznunk azt az AI Office nevű hatóságot, ami másodlagos hatóságként, de az AI-jal kapcsolatos ügyekkel foglalkozik, pont amiatt, hogyha bármilyen kérdés, jogsértés, egyéb más vetődik föl, legyen meg a megfelelő szervezetünk. Mi úgy döntöttünk, hogy erre egy önálló hatóságot hozunk létre, erről még folynak egyébként a viták, mert különböző országoknak különböző volt a meglátásuk ebben az ügyben. Több ország azt mondta, hogy az ottani adatvédelmi hatósághoz rendelték ezt a funkciót, mert azt mondják, hogy a mesterséges intelligencia adatalapú, tehát az adatok felhasználását, az adatokhoz való hozzáférést ott próbáljuk meg rögzíteni. Ez ízlés kérdése, szerintem a mesterséges intelligencia ennél sokkal több mindent jelent, a fejlődését jobban szolgálja az, ha önálló hatóság van, mintha egyértelműen egy hatósághoz rendeljük, de ez döntés kérdése a tagállamok esetében. A jogi hátteret tekintve, már 2020-ban létrehoztuk a Nemzeti Adatvagyon Ügynökséget, a NAVÜ-t. Ennek az a dolga, hogy az államnál rendelkezésre álló adatokat megfelelő bizalmassági elvárások mellett, tehát anonizálva, ne lehessen visszakövetkeztetni arra, hogy kié volt, de áruba tudja bocsátani. Az áruba bocsátás azt jelenti, hogy ha valaki üzleti célra akarja alkalmazni, fizessen azért az adatért, amit megkap, de egyébként használja egy termék kifejlesztésében. Ha valaki kutatni akarja ezeket, nyilván nem kell fizetni érte, csak azt kell garantálni, hogy ne lehessen a kutatás alatt sem visszakövetkeztetni az alanyokra, illetve ha maga az adatgazda akarja használni, azt milyen feltételek mellett teheti. Ez a NAVÜ-nek a feladata. Van még egy szereplő, egy cég, amely rendelkezik azzal a képességgel, hogy ezeket az adatokat anonimizálni tudja. Ha ezeket rendezzük, akkor tulajdonképpen olyan nagyon hátrányos helyzetet Európában nem állítottunk elő. Nagyon fontos azt is érteni, hogy ennek azért feltételei vannak. Az egyik ilyen a számítási kapacitás, ezt szuperszámítógépnek szokták nevezni. Itt Magyarország is erősen tevékenykedik, ez az én egyik feladatom is, hogy hozzuk létre azt a nagy teljesítményszámítási kapacitást, ami alkalmas arra, hogy ezt az előbb elmondott optimális feladatot végrehajtsuk. Tehát föltanítsuk ezeket a neurális hálókat.
Ez egy biztonsági, vagy szuverenitási kérdés, hogy sajátunk legyen?
Vannak olyan ügyek, amelyek esetében nem az, tehát van, ahol a felhőben lévő kapacitás elérhető, van, ami nem nemzetbiztonsági kérdés, nyugodtan lehet használni. Most az, hogy a történelem és a magyar nyelvtankönyveket a felhőben lévő kapacitásra tanítsuk föl, semmifajta nemzetbiztonsági kérdése nincs. Az, hogy a magyar genomról valaki teljes képet tudjon kapni, mondjuk az EESZT adatai alapján, annak már van nemzetbiztonsági vetülete, azt már célszerű itthon tartani. Ugyanez igaz, ha mondjuk, a NAV adatait akarja valaki használni – nyilván mindig neutralizált módon –, az sem biztos, hogy egy felhőben lévő kapacitáson kell tanítani, inkább lokális helyzetben. Ezeket előírja a jogszabály is, meg az adatgazda is tud feltételeket támasztani. A szuverenitás az, hogy legyen ilyenfajta kapacitásunk, vannak olyan adataink, amiket nem akarunk a felhőben tudni, de ez inkább befektetési, illetve technológiai kérdés. Ha megnézzük, hogy mennyi kapacitása van Finnországnak, az már 300 petaflops környékén van. Finnország kicsivel kisebb ország, mint a miénk, merthogy ők azt mondják, hogy a tőkevonzás érdekében, olyan cégeknek, amelyek egyébként mesterséges intelligencia alkalmazásokat fejlesztenek Finnországban, kell ilyen számítási kapacitás. Ott ez egy jól meghatározott üzleti kérdés. Mi is ebbe az irányba haladunk, messze nem tartunk még itt, de nekünk is lesz most egy 20 petaflopsos gép, már van egy öt petaflopsos, korábban az OTP-nek volt egy 27 petaflopsos gépe, ez egyben jó befektetés, hiszen ezt a kapacitást el lehet adni. Azon túl, hogy persze van egyfajta szuverenitási kérdése is. Nagyjából ezek azok az ügyek, amiket ha rendezünk, nem gondolom azt, hogy bennünket Európában, Amerikával szemben, bárki limitálhatna, hiszen egy országot alapvetően az az adott mennyiség limitálja, ami ott elérhető.
Ha lesz ilyen hatóság, akkor mindenki az alá fog tartozni, vagy lesznek duplikátumok, meg speciális szakterületek?
Ez egy másodlagos hatóság, ha úgy tetszik. Tehát ha mondjuk a fogyasztóvédelmi hatóság egy olyan rendszerrel szembesül, ami egy olyan szoftver, ami egyébként AI alapon működik, és ez egyébként valamilyen fogyasztói problémát okozott, akkor az lesz a feladata az AI hatóságnak, hogy miután megnézte, eldöntse, hogy ez rendben van-e így. Nagyon sok mindent kell, hogy rendezzen. Nagyon az elején vagyunk ennek az útnak, tegyük ezt is hozzá, ez most kezd kialakulni Európában is. Most látjuk azt, hogy mi milyen ügyekkel fogunk szembesülni. Ez egy komoly terület, felvetődhetnek akár olyan kérdések, hogy egy tetszőlegesen valahol rögzített hangfelvétel, meg egy filmfelvétel alapján valakinek megcsinálják az avatárját, és ez az avatár egyébként politikai kijelentéseket tesz. Ezeket valamilyen formában mindenképpen kezelni kell, mert ez nem történhet meg.
Ezt ezt ki kezeli? A kibervédelmi hatóság? Az AI hatóság?
Az AI hatóság, amikor arról van szó, hogy meglévő adatok alapján, AI alkalmazással, létrehoztuk az avatárt, s az arra buzdít, hogy menjünk, nem tudom, tüntetni, akkor az nem helyes, ezt rendezni kell valamilyen formában.
Kivéve, ha a gyülekezési jog szabályait betartja.
De ha mondjuk, valaki arra biztat, hogy baltával menjünk tüntetni azt azért nyilván kezelni kell, ez az AI hatóságnak egyébként a dolga.
Az látszik-e már, hogy az európai Green Deal, meg a mesterséges intelligencia fejlesztésének áramigénye között milyen összefüggés van?
Ez egy jó kérdés. Az áramigénye egyértelműen nagy a szuperszámítógépes kapacitásoknak, ezek nagyon nagy teljesítményű számítógépek, nemcsak energiát használnak, hanem azzal is foglalkozni kell, hogy az egyébként általa generált hőenergiát mindenképpen fel kell használni. Csak egy példa azért, hogy értsük, most tervezzük ezt a 20 petaflopsos kapacitásunkat. Két helyszín van, ami erre alkalmasnak tűnik ebben a pillanatban. Az egyik a HUN-REN-hez tartozó Wigner Kutatóközpont egyik gépterme, a másik pedig a jelenlegi szuperszámítógépes kapacitásunkat is tartalmazó debreceni gépterem. Mind a két esetben a legnagyobb kérdés az, hogy mit csinálunk azzal a hőenergiával, ami ott felszabadul.
Paradicsomot termelnek, vagy lakásokat fűtenek?
Igen, csak ehhez ott kell lennie a paradicsomtenyészetnek, meg ott kell lennie a lakásnak, ahol a szuperszámítógép van, vagy legalábbis a közelben. Debrecenben például egy uszodának a fűtését fogják ellátni vele. A Wigner esetében olyan mobil hőtároló megoldásokat terveznek, ahol a hő elvihető onnét. Tehát fizikailag megfogom mondjuk azt a homok akkumulátort, amiben egyébként tároltam, és odébb viszem egy kilométerre, és akkor ott szintén lakást hűtők vele. Nem véletlen az, hogy amerikai nagy techcégek az atomerőművek újraindításán gondolkoznak, mert egyszerűen ennek a dolognak komoly kapacitásigénye van, 500 megawatt.
Stabilnak is kell lennie, nem függhet külső hálózattól.
Annak sokfajta feltétele van, ezért a naperőművekkel történő szuperszámítógép-ellátás nem a legjobb, ezért javasolják ők is azt, hogy akkor leállított atomerőművet indítsanak újra. Érdekes, hogy az Európai Unió országainak jelentős része elkezdett pozitív irányba fordulni, az atomerőművek tekintetében. Németország lesz itt érdekes, leállította az atomerőműveit, de Németország a világ egyik legfejlettebb országa a hightechben. Ha nagy teljesítményű szuperszámítógépeket kíván működtetni, ott van a legnagyobb Jülichben egyébként, a mi partnerünk ráadásul, akkor ők is meg fogják fontolni azt, hogy az egyébként jó állapotú atomerőműveiket, amiket politikai okokból állítottak le, nem volt más indoka a fukusimai katasztrófa után, újraindítsák.
Nem elég a francia kapacitás? Minden második faluban van egy atomerőmű, kis túlzással.
Egyelőre igen, de ha telepítünk két komolyabb szuperszámítógépet, akkor már nem biztos, hogy elég lesz.