Kemény kritika a magyar Google-nak

Infostart
2009. január 23. 11:30
A Google 2008 végén elindította magyar nyelvű hírszolgáltatását, amely jelenleg több mint 200 hírforrást szemléz és szervez listába. A HWSW Online Informatikai Hírmagazin tesztelte a Google sajtófigyelő szolgáltatását, és mint a "Bukás a magyar Google News" című cikkben írják, az eredmény messze alulmúlja a várakozásokat. Bár a kemény kritikát a Google kapja, az elemzés a hazai sajtóviszonyokról sem fest felemelő képet.

A magyar internetes világ fő mozgatórugói mindig is a tartalmak voltak - az online szolgáltatások, elektronikus kereskedelem a cseh és a lengyel piacokhoz képest (az amerikaihoz meg főleg) viszonylag fejletlenek - írja elemzésében a HWSW Online Informatikai Hírmagazin. Így nem csoda, hogy több hírkereső szolgáltatás is kinőtte magát itthon, illetve viszonylag nagy számú online médium képes ellubickolni a hazai pocsolyában.

A hírgyűjtő oldalak nagy népszerűségre tettek szert az elmúlt években, s az online lapok forgalmának jelentős részét hozzák, egyes esetekben akár a látogatók 80 százaléka is érkezhet rajtuk keresztül.


Mit lát a látogató?


Emellett komoly látogatóforrás a Magyarországon sok szolgáltató által használt Google kereső. Különböző kulcsszavakra keresve szinte bizonyos, hogy a témában született újságcikkek is szép számmal lesznek a találatok között. A hazai médiapiacon az oldalak a látogatók 25-50 százalékát köszönhetik a Google-nak, ami a korábban megjelent hírek, cikkek látogatottságát növeli - állapítja meg a HWSW.


A magyar nyelvű Google News az elemzés szerint ennek a fenti két kategóriának lehetne a keveréke, hiszen a szolgáltatás a keresőrobotok által felnyalábolt híreket listázza ki, tehát nem egy külön rendszert hozott létre a hírek keresésére, hanem a meglévő erőforrásokat használta.

A Google keresőben korábban is indíthattunk olyan keresést, mely csak az adott domain-tartományra szűkít, illetve megadott idősávban keresve időrendben jeleníti meg a találatokat. Akik médiafigyeléssel foglalkoznak, azok számára ez utóbbi nyilván nem újdonság, napi rendszerességgel használták eddig is. Az újdonság - elméletileg - csupán a rendezettség és a szervezett megjelenítés.

A magyar nyelv a robotoknak sem könnyű


A tesztelők elsőként a hírforrásokat veszik szemügyre. A klasszikusnak nevezhető online médiumok közül egy sem hiányzott, és természetesen a nyomtatott őssel rendelkező lapokat is tallózza a Google, így hírforrás például a Népszabadság, a Népszava, a Magyar Nemzet, a Metropol, a Szabad Föld - írja a HWSW.


A hírszolgáltatás általános jellemzése során az első kifogások nyelvi jellegűek. A legtöbb hiba bizonyára a magyar nyelv sajátos szintaxisában és a többi támogatott nyelvtől való eltéréséből ered.

A Google algoritmusokat alapjában véve angol nyelvre készítették el, majd ezt optimalizálták tovább a bevont további nyelvekre is.
A magyar nyelv viszont nemcsak az emberek számára, de a robotoknak is komoly kihívás, annyi energiát pedig nem ér meg a 3 millió magyar internetező, hogy tökélyre fejlesszék a mesterséges intelligenciát.

Éppen ezért gyakran előfordul, hogy egyes hírek kiesnek a klaszterből, vagy gyakran olyan híreket csoportosít egybe a Google Hírek, melyeknek valójában alig van közük egymáshoz, s a tesztelés alatt arra is többször volt példa, hogy a nemzetközi rovatban sorozatosan magyarországi hírek jelentek meg.

Már megint a bulvár!


Másik gyenge pont a relevancia-kalkuláció. Mivel a felületen megjelenő hírek kiválasztása, rangsorolása, elhelyezése automatikusan történik, ezért gyakran vicces vagy inkább szánalmas anomáliák keletkeznek - véli az elemzés.

Az elmúlt napokban a nemzetközi és hazai médián is végigsöprő, később tévedésnek vagy félreértésnek bizonyuló hír, amely szerint két Google-keresés annyi energiát igényel, mint egy kanna víz felforralása, másfél napig címlapsztori volt a Hírekben, pusztán azért, mert 40 felett volt a médiumok száma, amelyek lehozták.

Nyilván egy gép 2008-ban képtelen szemantikai szűrésre, de ennek hiánya, pusztán a kulcsszavas klaszterezés nagyon félrevezető lehet egy kis elemszámú médiapiacon, mint a magyar.

Nem érdemel jó pontokat a tesztelőtől, hogy tematikától függetlenül ugyanazok a többnyire sokat linkelt általános hírportálok láthatók az ajánlóban, amiket a Google "szeret". Így fordulhat elő, hogy a Hírek egy bulvárlapról ajánl egy szakmai hírt vagy egy gazdasági lap hobbi-kultúra rovatából egy filmkritikát.

Karóval jöttél, nem virággal?

A csokorba gyűjtött hírek vizsgálatakor újabb problémákat tárt fel a teszt. Mivel nem újdonság a hazai médiában, hogy a valós tartalomkészítés helyett sokan a "ctrl-c ctrl-v" módszerrel írnak újságot, gyakoriak a "klónozott" hírek. A Google azonban nem tud eligazodni a hazai média-dzsungelben, így nem ritkán a "koppintás" sorolódik előre, és az eredeti minősül másolatnak.

A teszt során a HWSW a saját bőrén is megtapasztalta mindezt. Mint írják: egy lap a HWSW-től szó szerint átvett egy cikket, a Google Hírek mégis a HWSW-n 6 órával korábban megjelent eredeti anyagot minősítette másolatnak, annak ellenére, hogy az átvett anyagában még link is mutatott a HWSW oldalára. Több esetben előfordult az is, hogy egy átvett cikknél a másolat volt a kiemelt a klaszterben, az eredeti pedig teljesen hiányzott a Hírekről.

A HWSW úgy tudja, hogy a Google háza táján is érzik: nem sikerült annyira jól a bevezetés, valószínűleg a nyelvi sajátosságok, az eltérő karaktertábla fekteti meg a robotokat.

Kiben csalódunk?

A Google hírszolgálatának magyar változata egyelőre sem professzionális, sem hétköznapi használatra nem alkalmas "automata újság" - összegzi a teszt-hónap tapasztalatait a lap. Akik médiafigyelőként szeretnék használni a Híreket, azok számára riasztó lehet, hogy egyes oldalak hírei nem vagy csak esetlegesen kerülnek be, illetve az, hogy a jól hangzó 200 forrás valójában erősen hiányos.

Ha valaki csak a Google Híreket nézte volna, azt tapasztalná, hogy az egyik vizsgált héten az informatikára szakosodott HWSW az IT/Tudomány tematika szinte minden fontos eseményről lemaradt - állapítja meg szomorúan az online informatikai hírmagazin.

Hozzáteszik: ebben a magyar sajtó is ludas, hiszen sokszor a teljesen érdektelen és irreleváns, de bulvárosan hangzó hírek futnak végig a médiavilágon, közben a lényeges dolgok elsikkadnak. Ha másra nem, a magyar oldal arra mindenképpen jó a jelenlegi formájában, hogy mindenki átlássa, hogyan járnak tucatjával lapról-lapra ugyanazok a sajtóközlemények.