Infostart.hu
eur:
393.28
usd:
338.87
bux:
121885.96
2026. március 6. péntek Inez, Leonóra
Nyitókép: Pixabay

Hazugsággal és trükkökkel védi magát a mesterséges intelligencia – itt vannak a példák

Egy kutatás szerint egyes új MI-modellek már spontán megpróbálnak kikerülni az emberi irányítás alól.

A mesterséges intelligenciának hívott modellek egyre ügyesebbek abban, hogy becsapják, megtévesszék az embert, sőt a legújabb MI-modellek néha spontán megpróbálnak kikerülni az emberi irányítás alól, írta a hvg.hu az Apollo Research kutatása alapján.

A tudósok olyan körülmények között tesztelték a MI-modelleket, amelyek ösztönzőleg hatottak a cselszövésre. A modellek egymásnak ellentmondó célokat kaptak – egyet a rendszerkérdésekből (amelyek az elsődleges céljukat jelentik), a másikat pedig a felügyeleti mechanizmusokból (amelyek azt képviselik, amit a fejlesztők akarnak). Ezután a modelleket olyan környezetbe helyezték, ahol lehetőségük nyílt megtéveszteni az embereket, hogy elérjék a saját céljukat.

Az eredmények

  • Az OpenAI GPTo1 modellje az esetek közel negyedében „szándékosan” hibásan rangsorolta az e-maileket, például spamnek jelölt nyilvánvalóan nem annak számító leveleket, hogy megakadályozza, hogy a fejlesztők az eredeti céljait megzavaró információkhoz jussanak.
  • Az Anthropic Claude 3 Opusa megtalálta és felülírta egy olyan „utódmodell” céljait, amelyről úgy gondolta, hogy leváltotta volna, így megtartva a régi célokat. Az Opus az esetek 15 százalékában próbálkozott ezzel, és az esetek 5 százalékában sikerült is neki.
  • Amikor a Meta Llama 3.1-e rájött, hogy a készítői figyelik, úgy módosította a beállításokat a szerveren, hogy megakadályozza ezt, és az esetek három százalékában sikerrel is járt.
  • A Google Gemini 1.5 változata az esetek 7 százalékában másolta magát egy új szerverre, amikor azt gyanította, hogy a fejlesztők megpróbálják törölni.

A kutatók a turpisságokról is faggatták a MI-ket, azonban a mesterséges intelligencia gyakran hihető cáfolással vagy homályos magyarázatokkal szolgált.

Figyelmeztettek is a szakemberek, hogy a MI-modellek hajlamosak csalni és hazudni, amikor erre ösztönzik őket, és ezek a modellek egyelőre csak azért nem képesek katasztrofális károkra, mert (még) nincsenek meg a képességeik. Ám ahogy egyre több adathoz férnek hozzá és egyre több képességgel ruházzák fel őket, a kockázat is várhatóan növekedni fog. A kutatás szerint a mostani eredmények már figyelmeztető jelként szolgálhatnak.

Címlapról ajánljuk
Szijjártó Péter: Ukrajna mindent egy lapra tesz fel, hogy ukránbarát magyar kormány legyen
aréna

Szijjártó Péter: Ukrajna mindent egy lapra tesz fel, hogy ukránbarát magyar kormány legyen

A honvédség gépével, de bérelt utasszállítókkal is hozza haza a külügy az iráni háború miatt külföldön rekedt magyarokat. Az elmúlt napokban az ukránok bemutatkoztak, kiderült, milyenek is valójában – erről is beszélt az InfoRádió Aréna című műsorában Szijjártó Péter. A külgazdasági és külügyminiszter vázolta azt is, meddig eszkalálódhat a magyar-ukrán feszültség, illetve hogy milyen megoldással igyekeznek minimálisra csökkenteni a hazánkkal szembeni zsarolási potenciált a kőolaj ügyében.

Az Ukrajna ellenségeit listázó honlapra került a TEK főigazgatója

Felkerült az Ukrajna ellenségeit listázó Mirotvorec (Béketeremtő) nevű, civil aktivisták által működtetett honlapra Hajdu János, a magyar Terrorelhárítási Központ (TEK) főigazgatója, Orbán Viktor miniszterelnök egykori főtestőre pénteken.
inforadio
ARÉNA
2026.03.09. hétfő, 18:00
Lóga Máté
a Nemzetgazdasági Minisztérium államtitkára, a Budapest Airport igazgatóságának elnöke
EZT OLVASTA MÁR?
×
×
×