Most először sikerült átmennie mesterséges intelligenciának a számítógépek emberszerűségét vizsgáló Turing-teszten, egy júniusban végzett kutatás eredménye szerint a teszten résztvevők 54 százaléka nem volt képes megkülönböztetni a ChatGPT 4.0-ás modelljét egy valódi beszélgetőpartnertől - írja a Portfolio.
A San Diego-i Egyetem által publikált kutatás alapján az OpenAI chatbotjával többé nem olyan könnyű feladat üzenetváltás során megkülönböztetni, hogy valódi emberrel vagy géppel beszélgetünk-e. A kutatásban 500 ember vett részt, és 5 percet kellett csevegniük egy átlagos üzenetküldőhöz hasonló felületen, miközben nem tudhatták, hogy egy valós személlyel vagy a három tesztelt MI-modell egyikével társalognak-e.
Az egyik tesztelt modell az ELIZA volt, az egyik első mesterséges intelligencia, amit az MIT kutatói fejlesztettek ki 1964 és 1969 között. Ez a rendszer még nem a nagy-nyelvi modellek és a neurális hálózatok alapján működik, hanem előre betanított válaszokkal dolgozik. A másik kettő a ChatGPT jelenleg is elérhető verziói, a 3.5-ös és a 4.0-ás modell volt.
A teszt során az ELIZA esetén szúrták ki a legkönnyebben a résztvevők, hogy géppel beszélgetnek, mindössze az esetek 22 százalékában tudta megtéveszteni az önkénteseket. A ChatGPT 3.5 már jobban szerepelt, itt az esetek felében hitték azt a jelentkezők, hogy emberrel beszélnek,
míg az OpenAI továbbfejlesztett, ChatGPT 4.0-ás modellje már a tesztek 54 százalékában győzte meg az embereket, hogy egy másik ember a társalgópartnerük, ezzel a történelemben először átment a Turing-teszten.
A tanulmány szerint a résztvevők többsége a beszélgetés során a stilisztikai jegyekre és a beszélgetőpartner személyiségének hitelességére alapozta a döntését.
Alan Turing, angol matematikus és számítógéptudós 1950-ben javasolta először, hogy egy ún. "utánzós játékhoz" hasonlóan, tesztnek kellene alávetni az akkoriban létező mesterséges intelligenciát, hogy kiderüljön, mennyire képes imitálni egy ember válaszait a számítógép. A kísérlet szerint az alanynak több, egymástól független beszélgetést is folytatnia kell egymás után, miközben tudatában vannak, hogy egynémely partnerük mesterséges intelligencia.
A módszert a kitalálása óta alkalmazzák, de eddig egy mesterséges intelligenciának sem sikerült átmennie rajta. A Turing-tesztet sok kritika érte, A LiveScience-nek nyilatkozó szakértő szerint "a stilisztikai és társadalmi-érzelmi tényezők nagyobb szerepet játszanak a Turing-teszt teljesítésében, mint az intelligencia hagyományos fogalmai". Azaz a teszt nem egy MI intelligencia-tesztjének felel meg, sokkal inkább azt méri, hogy mennyire tud minket megtéveszteni.