Infostart.hu
eur:
364.71
usd:
309.9
bux:
0
2026. május 3. vasárnap Irma, Tímea
Mesterséges intelligenciát használó nő szemüvegben / Woman using artificial intelligence technology on laptop with glasses reflection.
Nyitókép: Maria Korneeva/Getty Images

Magabiztos tévedések: milliószámra hibázhat a Google AI-ja

Ma már a Google-keresés együtt jár az AI Overviews-szal, a Gemini-alapú összefoglalóval, amely a találatok tetején jelenik meg. A funkció a 2024-es indulása óta sok kritikát kapott pontatlanságai miatt, bár ez azóta javult. Egy felmérés szerint a mesterséges intelligencia válaszainak tizede téves, vagyis a nap minden percében több százezer hazugság jelenik meg a Google-on.

A The New York Times egy Oumi nevű startup segítségével vizsgálta meg az AI Overviews pontosságát. A cég mesterséges intelligencia eszközöket használt a SimpleQA értékeléssel, amely egy gyakori teszt a generatív modellek, például a Gemini tényszerűségének rangsorolására. Az OpenAI által 2024-ben kiadott SimpleQA lényegében egy több mint 4000 kérdésből álló lista, ellenőrizhető válaszokkal, amelyek egy mesterséges intelligencia rendszerébe betáplálhatók.

Az Oumi tavaly kezdte el futtatni a tesztjét, amikor a Gemini 2.5 még a cég legjobb modellje volt. Akkoriban a benchmark 85 százalékos pontossági arányt mutatott. Amikor a tesztet a Gemini 3 frissítése után megismételték, az AI Overviews már

a kérdések 91 százalékát válaszolta meg helyesen. Ha ezt a hibázási arányt kivetítjük az összes Google-keresésre, az AI Overviews naponta több tízmillió helytelen választ generál

– írja az arstechnica.com, amit a Blikk szemlézett.

A jelentés számos példát tartalmaz arra, hogy az AI Overviews hol hibázott. Volt, hogy az AI Overviews olyan oldalakra hivatkozott, ahol a feltett kérdésre egyáltalán válasz, eltérő találatok esetében pedig magabiztosan a rosszat választotta.

A Google-nek természetesen nem igazán tetszik ez a teszt. Ned Adriance, a cég szóvivője a Timesnak elmondta, hogy a Google szerint a SimpleQA helytelen információkat tartalmaz. A modellértékeléseik gyakran egy hasonló, SimpleQA Verified nevű tesztre támaszkodnak, amely kevesebb, alaposabban ellenőrzött kérdést használ. „Ennek a tanulmánynak komoly hiányosságai vannak” – mondta Adriance, aki szerint „nem tükrözi, hogy az emberek valójában mit keresnek a Google-ben”.

A Google reakciója mindenesetre sokatmondó: a mesterséges intelligencia tényszerűsége terén már a 10-ből 9-es pontosság sem számít rossznak szerintük. A cég saját mérései szerint az új modellek 60–80 százalékos pontosságot érnek el – igaz, ezek a tesztek külső eszközök, például webes keresés nélkül zajlanak. Ha azonban az AI-t az internet hatalmas tudásbázisával „támasztják meg”, valóban pontosabbá válik, mint önmagában.

A probléma az, hogy az igazság gyakran a klasszikus „kék linkek” mögött rejtőzik, miközben az AI Overviews inkább arra ösztönzi a felhasználókat, hogy elfogadják az olykor pontatlan összefoglalókat, ahelyett hogy ellenőriznék a forrásokat. Bár a Google szerint egyes kritikák nem tükrözik a valós felhasználói élményt, nehéz megmondani, ezt mégis miből tudhatják, hiszen a hibák mindenki számára ismerősek – maga a vállalat is figyelmeztet: az AI tévedhet, ezért érdemes ellenőrizni a válaszokat – olvasható egyebek mellett.

Címlapról ajánljuk
Történelmi világcsúcs maratonfutásban – Csodacipő, speciális energiazselé, ideális időjárás

Történelmi világcsúcs maratonfutásban – Csodacipő, speciális energiazselé, ideális időjárás

Az élmezőny tagjai között nagyon komoly versengés alakult ki, egymást is inspirálták, motiválták. Valószínűleg ez is eredményezte azt az egyedülálló sportteljesítményt, hogy az első három helyezett megdöntötte a korábbi világcsúcsot – így értékelte az InfoRádióban a vasárnapi London Marathon eredményeit Gyimes Zsolt, a Magyar Testnevelési és Sporttudományi Egyetem Atlétika Tanszékének egyetemi docense.
inforadio
ARÉNA
2026.05.04. hétfő, 18:00
Fodor Gábor
volt miniszter, a Közép-európai Rendszerváltást Kutató Intézet vezetője
EZT OLVASTA MÁR?
×
×
×