Infostart.hu
eur:
389.26
usd:
335.68
bux:
0
2026. március 4. szerda Kázmér
Nyitókép: Peter Zelei Images/Getty Images

Magyar nyelvi elemzőrendszert fejlesztettek és tettek közkinccsé

A SZTAKI által koordinált Mesterséges Intelligencia Nemzeti Laboratórium (MILAB) projekt keretében a Szegedi Tudományegyetem kutatói elkészítették, és szabadon hozzáférhetővé tették a HuSpaCy magyar nyelvi elemzőrendszert, amely a mesterséges intelligencia és nyelvtechnológia legújabb kutatási eredményeit ötvözi egy magyar szövegeket elemezni képes könnyen használható eszközzé.

Az elmúlt évtized áttörést hozott a nyelvtechnológiában, nemcsak a kutatásokban, hanem abban is, hogy az akadémiai eredmények eljutottak arra a technológiai érettségi szintre, hogy azok már ipari forgalomban is használhatóak. Ma már olyan - akár kisebb - cégek is képesek szövegelemzési problémák megoldására, amelyek nem rendelkeznek MI-szakértelemmel - olvasható a SZTAKI közleményében.

A most elkészült magyar nyelvi elemzőrendszer már az iparban is használható erőforrásigénnyel és integrálhatósággal dolgozik, használatával egyszerűbbé válik a magyar nyelvű szövegek nyelvtani és jelentéstani értelmezése.

"A kifejezetten magyar nyelvű szöveges tartalmak, mondatok előfeldolgozási eszközkészletét készítettük el. Erre azért van szükség, mert minden alkalmazás, ami valamilyen szöveggel kapcsolatos problémát akar megoldani, csupán nyers karaktersorozatokból még nem tud működni. Természetes nyelvi szövegeken működő algoritmusok emberek által is értelmezhető nyelvtani szimbólumokra építenek, így a HuSpaCy megfelelő alapul szolgálhat csetbotokhoz vagy akár email értelmező rendszerekhez is" - idézik a közleményben Farkas Richárdot, a Szegedi Tudományegyetem kutatóját.

Az elmúlt évtizedben forradalom zajlott a mesterséges intelligencia kutatásában: a gépi tanulásos megoldásokon belül előre tört az úgynevezett mélytanulás (deep learning) módszere, ahol mesterséges neurális hálók képesek megtanulni, hogy mit hogy kell értelmezniük.

A ma használatos természetes nyelveket feldolgozó rendszerek nagy része így működik, azaz nem nyelvészek írnak szabályokat, hanem az úgynevezett tanuló algoritmusok képesek mélyebb összefüggések, predikciók elsajátítására.

Az ilyen rendszerek problémája, hogy alapvetően fekete dobozként viselkednek. Működésük alig megfigyelhető, tehát még ha jó eredményt is adnak, akkor sem tudjuk, hogyan jutottak erre a következtetésre. Ebből következik, hogy nem is jól kontrollálhatók, ezért ipari alkalmazásokban sokszor csak korlátozottan használhatóak.

Napjaink angol nyelvet támogató célalkalmazásaiban is gyakran csak a szövegek előelemzésére használnak gépi tanulás alapú megoldásokat, hogy aztán ezek alapján az emberi szakértő által írt szabályok hozzák meg a végső döntést. Így egy-egy döntés átláthatóvá válik, és kérdéses esetben az emberi szakértő akár meg is tudja változtatni a rendszer viselkedését.

A közleményben felidézik, hogy a magyar nyelvű szövegelemző szoftverek fejlesztése nem ma kezdődött. A magyar kutatói közösség már a kétezres években elkezdte építeni a szükséges nyelvi adatbázisokat. Ezeket az adatbázisokat használták a HuSpaCy fejlesztői is, mint tanító adatbázis.

Címlapról ajánljuk
Az iráni háború már 13 országra terjedt ki, és Kaiser Ferenc szerint nem látni, meddig eszkalálódik tovább

Az iráni háború már 13 országra terjedt ki, és Kaiser Ferenc szerint nem látni, meddig eszkalálódik tovább

Már legalább 13 országot érint a Közel-Keleten zajló fegyveres konfliktus a Nemzeti Közszolgálati Egyetem docense szerint. Kaiser Ferenc az InfoRádióban azt mondta: a háború alapvetően Irán, Izrael és az Egyesült Államok között zajlik, de közvetetten részt vesz a konfliktusban több Iránhoz köthető „proxy”, vagyis helyettes is, mint a libanoni Hezbollah vagy a jemeni húszik. A szakértő hozzátette: a legnagyobb hatótávolságú iráni ballisztikus rakéták Romániát még elérik, de Magyarországot nem.

Hortay Olivér az Arénában: két módon is súlyosan roncsolódik most a világ olajellátása

A Hormuzi szoros kiesése a nemzetközi olajpiaci útvonalakból nagy érvágás, de legalább ennyire komoly probéma, hogy a megtámadott Irán válaszcsapásként a környező országok infrastruktúráját támadja – mondta az InfoRádió Aréna című műsorában Hortay Olivér közgazdász, a Századvég Konjuktúrakutató Zrt energia- és klímapolitikai üzletágvezetője.
inforadio
ARÉNA
2026.03.04. szerda, 18:00
Resperger István
ezredes, a Magyar Agrár- és Élettudományi Egyetem Szent-István Biztonságkutató Központ igazgatója
Dubaj és Bejrút támadás alatt, Trump biztosítaná a Hormuzi-szorost, kiderült, mikor lesz új iráni vezető – Híreink az iráni háborúról percről percre szerdán

Dubaj és Bejrút támadás alatt, Trump biztosítaná a Hormuzi-szorost, kiderült, mikor lesz új iráni vezető – Híreink az iráni háborúról percről percre szerdán

Ötödik napja tart Izrael és az Egyesült Államok háborúja Irán ellen. A libanoni főváros, Bejrút közelében egy szállodát, az iráni Kom városában pedig a Szakértői Tanács épületét támadták meg, beszámolók szerint a halálesetek száma mindkét országban túllépte a 800-at. Teherán válaszcsapása számos amerikai érdekeltségű célpontot sújtott: az USA dubaji konzulátusa, egy szaúd-arábiai CIA-állomás és egy Katarban lévő amerikai támaszpont mind találatokat szenvedett el. Az iráni védelmi minisztérium szerint készen állnak az elhúzódó háborúra, mondván, a legjobb fegyvereiket még nem is használták. Közben kiderült: a jövő héten, Ali Hámenei temetése után választják Irán következő legfőbb vezetőjét. Donald Trump elrendelte, hogy az Egyesült Államok "biztosítást és garanciát" nyújtson a Perzsa-öbölben közlekedő hajók számára, azt javasolva, hogy "szükség esetén" az amerikai haditengerészet kísérje a tankereket a világgazdasági szempontból kulcsfontosságú, Irán által lezártnak nyilvánított Hormuzi-szoroson. Az Egyesült Arab Emírségek biztonságos légi folyosókat nyitott a vele szomszédos országok számára, a Közel-Keleten megbénult a közlekedés, miközben a világ országai evakuálni próbálják a régióban rekedt állampolgáraikat. Cikkünk folyamatosan frissül.

EZT OLVASTA MÁR?
×
×
×