eur:
398.71
usd:
364.21
bux:
74011.67
2024. október 9. szerda Dénes
A magyar tudomány kategóriában Prima Primissima Díjra jelölt Prószéky Gábor matematikus, nyelvész, egyetemi tanár Budapesten 2023. október 18-án.
Nyitókép: MTI/Czimbal Gyula

Prószéky Gábor: néhány dologban lekörözi a PULI a ChatGPT-t

Azok a nyelvek lesznek túlélők, amelyeket a digitális világban is rendszeresen használnak, és a magyar szerencsére ilyen nyelv – mondta az InfoRádió Aréna című műsorában a HUN-REN Nyelvtudományi Kutatóközpont főigazgatója. A Széchenyi-díjas matematikus, nyelvész beszélt arról is, hogy kifejlesztették a magyar ChatGPT-t, a PULI-t, amely több tízmilliárd szóval dolgozik, és sokkal jobban ismeri a magyar kultúrát, mint az OpenAI terméke.

Prószéky Gábor is tagja annak az akadémiai szerkesztőbizottságnak, amely egy széles körű vitafórumot követően jelentést fogadott el a magyar nyelv állapotáról. A tanulmány első megállapítása, hogy a magyar nyelv nincs veszélyben. A Széchenyi-díjas matematikus, nyelvész azt mondta az InfoRádió Aréna című műsorában, hogy nagyon sokan tartanak attól, hogy a magyar nyelv egyszer eltűnik majd, de ennek szerinte nincs megalapozottsága, ugyanis több mint tízmillióan beszélik, és ami legalább ugyanennyire fontos, írott formában, az interneten is nagyon erősen támogatott nyelv a magyar.

Mint fogalmazott, korábbi felmérések azt állapították meg, hogy azok a nyelvek az igazi túlélők, amelyek a digitális világban is megtalálják a támogatásukat, márpedig napjainkban jelentős mennyiségű magyar szöveg érhető el a világhálón. Kiemelte, hogy az írókat, szerzőket számos nyelvhelyességi eszköz segíti, illetve a magyar Wikipédia is „a nagyok közé tartozik a világban”. Mindezek azt bizonyítják, hogy megvan az említett nyelvi támogatottsága az interneten a magyar nyelvnek, így Prószéky Gábor szerint nincs is veszélyben a fennmaradása. Úgy véli, az emberek inkább csak féltik a magyar nyelvet, és „megjelennek bizonyos szavak, amelyeknek nem kellene megjelenniük”. Hozzátette: a kihalás egészen távoli dolog, és inkább a kisebb, kevesebb ember által használt nyelveket veszélyezteti. Általában valamilyen politikai vagy társadalmi ok vezet odáig, hogy lecserélnek egy-egy nyelvet vagy éppen teljesen eltűnik.

Mint mondta, sokan úgy gondolják, hogy a szaknyelvek esetében a magyar is ebben a helyzetben van, de megnyugtatott mindenkit, hogy nem cserélik le a magyar nyelvet. A nyelvész szerint érdemes végiggondolni, hogy milyen szinten lehet veszélyben egy nyelv. A nyelvészek általánosságban véve nyelvi szintekről beszélnek, a jelentéstan szerint pedig tudunk beszélni a dolgokról, így a szintaxis (a nyelvtan szószerkezetekkel és mondatokkal foglalkozó része), a nyelv, valamint mondatok formálása Prószéky Gábor szerint nincs veszélyben, mint ahogy a szóalaktanunk sem változik meg.

Felhívta a figyelmet arra is, hogy egy-egy nyelv megváltozása, átalakulása nagyon hosszú folyamat, akár évszázadokig is eltarthat. Az idő múlásával főként a szókincs változik, megjelennek új formák, és ezeknek az új szavaknak, kifejezéseknek napjainkban leginkább angol a gyökerük. A HUN-REN Nyelvtudományi Kutatóközpont főigazgatója szerint ennek az a fő oka, hogy az egész világon az angol vált a meghatározó nyelvvé, és rengeteg fogalmat, szót az angolból vesznek át más nyelvek.

Ebben nincs semmi újdonság, hiszen a korábbi évszázadokban is mindig hatással volt például a magyar nyelvre is, hogy milyen népek, nemzetek éltek körülöttünk vagy kik törtek be Magyarországra, és maradtak itt hosszú időn át. Ennek következtében jelentek meg és terjedtek el a magyar nyelvben török, szláv, latin vagy éppen germán szavak, kifejezések. „Most az angollal vagyunk ilyen szomszédságban, de hát mindenki ugyanolyan távolságra van ma egymástól az interneten” – jegyezte meg Prószéky Gábor.

Mit tud jobban a magyar fejlesztésű PULI a ChatGPT-nél?

Egyre több, mesterséges intelligencia (MI) által vezérelt nyelvi modell, chatbot érhető el az emberek számára, ilyen például a ChatGPT, a Gemini és a Copilot is, mint ahogy megjelent az első magyar nyelvi modell, a PULI is, amely 50 milliárd magyar szavas szövegkorpuszával jobban modellezi a magyar nyelvet, mint nagy nemzetközi társai. A PULI chatbotot a Nyelvtudományi Kutatóközpont álmodta meg és hozta létre, a fejlesztésében Prószéky Gábor is részt vett. A nyelvész emlékeztetett, hogy a Microsoft tavaly tízmilliárd dollárt adott az OpenAI mesterséges intelligencia kutatólaboratóriumnak, hogy továbbfejlessze a ChatGPT modellt. Ennek ismeretében sokakban felmerülhet a kérdés, hogy miért lenne szükség egy magyar chatbotra? Prószéky Gábor megfogalmazása szerint

a PULI „egy kicsit sárgább, egy kicsit savanyúbb, de a miénk, és ez az igazán fontos, hiszen mégiscsak magyar fejlesztésről van szó”.

Elismerte, hogy a magyar nyelvi modell nyilvánvaló módon nem tud majd versenyezni a ChatGPT-vel és nagy nemzetközi társaival, de reményeik szerint így is nagyon hasznos és értékes lesz, mivel „a magyar nyelvre van kihegyezve”, és sokkal nagyobb mennyiségben lehet általa magyar kulturális tudást „beletenni a közösbe” a világ nagy szoftvereihez képest. Utóbbiak vagy éppen a Wikipédia 100-150 millió szónyi magyar szöveget tartalmaznak, melyek révén egész jól lehet meg lehet érteni a magyar nyelvet, viszont ezek a szoftverek nem tudnak létrehozni magyar kulturális tartalmat. „Például nem tudják összevetni Arany János és Petőfi Sándor verseit” – magyarázta a Széchenyi-díjas matematikus, nyelvész.

Úgy véli, a PULI abban lehet „erősebb” a konkurenseknél, hogy magyar kulturális tartalmat tesz közzé. Kiemelte, hogy az egész világon elterjedt nagy chatbotok „nagyon jól tudnak magyarul”, ugyanakkor jelentős különbség érzékelhető a 130 millió versus 50 milliárd elérhető szó között, utóbbit a PULI tudja kínálni. Elismerte, hogy a nagy nemzetközi rendszerek fejlettebbek és sokkal kifinomultabbak, ugyanakkor kiemelte, hogy

a PULI-t adott esetben átadhatják egy magyar partnernek, amely aztán a saját hardverbázisán működtetni tudja.

Így „nem kell kiküldeni a Csendes-óceán partjára vagy bárhová a világba azt a tartalmat, ami esetleg érzékeny adatot tartalmaz” – tette hozzá a nyelvész.

Prószéky Gábor jelezte: a világnyelvek után a magyar és a svéd szakemberek fejlesztették ki elsőként hazájuk nyelvi modelljét, megelőzve például a portugálokat. „Nagyon korai fázisban jelentünk meg a magyar nyelvvel, és emiatt most nagyon jó helyzetben van a magyar számítógépes nyelvészet, illetve nyelvtechnológia. Ez nem azért van, mert magyar, hanem mert minden olyan tartalomra, ami lokálisan érzékeny, adott esetben akár más nyelven is rá lehet keresni” – magyarázta.

Kiemelte, hogy a PULI egy háromnyelvű rendszer, amelyben a magyar mellett angol és kínai szöveg is elérhető. Az 50 milliárd szónyi összefüggő magyar szöveg mellett 50-60 milliárd szónyi angol és körülbelül 100 milliárd jelnyi kínai tartalom is olvasható a magyar fejlesztésű modellnek köszönhetően. Prószéky Gábor szerint a PULI „a magyar rendszert, a magyar kultúrát nagyon fogja tudni, de ugyanígy az euroatlanti és a távol-keleti világot is”.

KAPCSOLÓDÓ HANG
Címlapról ajánljuk

Orbán Viktor a strasbourgi plenáris vita végén: "ócska propaganda terepévé vált az Európai Parlament"

Szerdán - az árvíz miatt három hét késéssel - több órán keresztül vitáztak az Európai Parlament plenáris ülésén a magyar EU-elnökségi programról, illetve Orbán Viktor európai szerepéről, kormányzásáról. A heves szóváltásokkal tarkított vitát Orbán Viktor szavai zárták.
VIDEÓ
inforadio
ARÉNA
2024.10.10. csütörtök, 18:00
Káel Csaba
a MÜPA vezérigazgatója, filmügyi kormánybiztos
EZT OLVASTA MÁR?
×
×
×
×
×