Infostart.hu
eur:
355.73
usd:
313.04
bux:
138853.98
2026. június 25. csütörtök Vilmos
Nyitókép: Peter Zelei Images/Getty Images

Magyar nyelvi elemzőrendszert fejlesztettek és tettek közkinccsé

A SZTAKI által koordinált Mesterséges Intelligencia Nemzeti Laboratórium (MILAB) projekt keretében a Szegedi Tudományegyetem kutatói elkészítették, és szabadon hozzáférhetővé tették a HuSpaCy magyar nyelvi elemzőrendszert, amely a mesterséges intelligencia és nyelvtechnológia legújabb kutatási eredményeit ötvözi egy magyar szövegeket elemezni képes könnyen használható eszközzé.

Az elmúlt évtized áttörést hozott a nyelvtechnológiában, nemcsak a kutatásokban, hanem abban is, hogy az akadémiai eredmények eljutottak arra a technológiai érettségi szintre, hogy azok már ipari forgalomban is használhatóak. Ma már olyan - akár kisebb - cégek is képesek szövegelemzési problémák megoldására, amelyek nem rendelkeznek MI-szakértelemmel - olvasható a SZTAKI közleményében.

A most elkészült magyar nyelvi elemzőrendszer már az iparban is használható erőforrásigénnyel és integrálhatósággal dolgozik, használatával egyszerűbbé válik a magyar nyelvű szövegek nyelvtani és jelentéstani értelmezése.

"A kifejezetten magyar nyelvű szöveges tartalmak, mondatok előfeldolgozási eszközkészletét készítettük el. Erre azért van szükség, mert minden alkalmazás, ami valamilyen szöveggel kapcsolatos problémát akar megoldani, csupán nyers karaktersorozatokból még nem tud működni. Természetes nyelvi szövegeken működő algoritmusok emberek által is értelmezhető nyelvtani szimbólumokra építenek, így a HuSpaCy megfelelő alapul szolgálhat csetbotokhoz vagy akár email értelmező rendszerekhez is" - idézik a közleményben Farkas Richárdot, a Szegedi Tudományegyetem kutatóját.

Az elmúlt évtizedben forradalom zajlott a mesterséges intelligencia kutatásában: a gépi tanulásos megoldásokon belül előre tört az úgynevezett mélytanulás (deep learning) módszere, ahol mesterséges neurális hálók képesek megtanulni, hogy mit hogy kell értelmezniük.

A ma használatos természetes nyelveket feldolgozó rendszerek nagy része így működik, azaz nem nyelvészek írnak szabályokat, hanem az úgynevezett tanuló algoritmusok képesek mélyebb összefüggések, predikciók elsajátítására.

Az ilyen rendszerek problémája, hogy alapvetően fekete dobozként viselkednek. Működésük alig megfigyelhető, tehát még ha jó eredményt is adnak, akkor sem tudjuk, hogyan jutottak erre a következtetésre. Ebből következik, hogy nem is jól kontrollálhatók, ezért ipari alkalmazásokban sokszor csak korlátozottan használhatóak.

Napjaink angol nyelvet támogató célalkalmazásaiban is gyakran csak a szövegek előelemzésére használnak gépi tanulás alapú megoldásokat, hogy aztán ezek alapján az emberi szakértő által írt szabályok hozzák meg a végső döntést. Így egy-egy döntés átláthatóvá válik, és kérdéses esetben az emberi szakértő akár meg is tudja változtatni a rendszer viselkedését.

A közleményben felidézik, hogy a magyar nyelvű szövegelemző szoftverek fejlesztése nem ma kezdődött. A magyar kutatói közösség már a kétezres években elkezdte építeni a szükséges nyelvi adatbázisokat. Ezeket az adatbázisokat használták a HuSpaCy fejlesztői is, mint tanító adatbázis.

Címlapról ajánljuk
A MOB főtitkára elmondta, hogy képzeli el a közös munkát az új sportállamtitkárral

A MOB főtitkára elmondta, hogy képzeli el a közös munkát az új sportállamtitkárral

A Magyar Olimpiai Bizottság idén is megrendezte az Olimpia Napját a Városligetben, ahová számos nagy sztár, olimpiai bajnok is kilátogatott, és együtt sportolt vagy beszélgetett a rajongókkal. Fábián László az InfoRádióban beszélt az esemény legfőbb értékeiről, az olimpiai felkészülés aktualitásairól és arról is, mire számít az új sportállamtitkársággal való együttműködéstől.

Ukrajna: „már mi teszünk szívességet a tűzszünettel Oroszországnak”

Ukrajna türelme nem véges és visszavonhatja tűzszüneti ajánlatát, ha nincs lényegi nemzetközi nyomás a háború leállítására – közölte a kijevi kormány megbízottja. Ukrajna úgy érzi, egyre jobban állnak a fronton, a tömeges dróntámadásoknak köszönhetően. Közben az amerikai kormányzat egyik tagja „az európaiak szellemi fogyatékos gyerekének” nevezte Zelenszkij ukrán elnököt.
Nem találtak magukra a techcégek eladási hullámában a tőzsdék

Nem találtak magukra a techcégek eladási hullámában a tőzsdék

Vegyes hangulat volt a nemzetközi tőkepiacokon: a közel-keleti feszültségek valamelyest enyhültek, de az elmúlt napok technológiai részvényeket sújtó korrekciója még nyomás alatt tarotta a tőzsdéket. A hangulatot javította, hogy az Irán és Izrael közötti konfliktus csillapodásával mérséklődtek az olajellátással kapcsolatos aggodalmak, és a Hormuzi-szoros hajóforgalma is fokozatosan normalizálódik, de továbbra is visszafogja a kockázatvállalási kedvet, hogy globális eladási hullám indult a technológiai részvényekben. Az arany héthónapos mélypontra került, a dollár pedig erősödik. Európában vegyes volt a kép: a Dax esett, míg a CAC40 enyhe pluszban állt meg. Az amerikai tőzsdék ugyan jó lendülettel kezdték a napot, de estére egyedül a Dow Jones tudott pluszban zárni.

EZT OLVASTA MÁR?
×
×
×