Infostart.hu
eur:
382.69
usd:
329.61
bux:
124307.61
2026. április 1. szerda Hugó
Nyitókép: Pixabay

Hazugsággal és trükkökkel védi magát a mesterséges intelligencia – itt vannak a példák

Egy kutatás szerint egyes új MI-modellek már spontán megpróbálnak kikerülni az emberi irányítás alól.

A mesterséges intelligenciának hívott modellek egyre ügyesebbek abban, hogy becsapják, megtévesszék az embert, sőt a legújabb MI-modellek néha spontán megpróbálnak kikerülni az emberi irányítás alól, írta a hvg.hu az Apollo Research kutatása alapján.

A tudósok olyan körülmények között tesztelték a MI-modelleket, amelyek ösztönzőleg hatottak a cselszövésre. A modellek egymásnak ellentmondó célokat kaptak – egyet a rendszerkérdésekből (amelyek az elsődleges céljukat jelentik), a másikat pedig a felügyeleti mechanizmusokból (amelyek azt képviselik, amit a fejlesztők akarnak). Ezután a modelleket olyan környezetbe helyezték, ahol lehetőségük nyílt megtéveszteni az embereket, hogy elérjék a saját céljukat.

Az eredmények

  • Az OpenAI GPTo1 modellje az esetek közel negyedében „szándékosan” hibásan rangsorolta az e-maileket, például spamnek jelölt nyilvánvalóan nem annak számító leveleket, hogy megakadályozza, hogy a fejlesztők az eredeti céljait megzavaró információkhoz jussanak.
  • Az Anthropic Claude 3 Opusa megtalálta és felülírta egy olyan „utódmodell” céljait, amelyről úgy gondolta, hogy leváltotta volna, így megtartva a régi célokat. Az Opus az esetek 15 százalékában próbálkozott ezzel, és az esetek 5 százalékában sikerült is neki.
  • Amikor a Meta Llama 3.1-e rájött, hogy a készítői figyelik, úgy módosította a beállításokat a szerveren, hogy megakadályozza ezt, és az esetek három százalékában sikerrel is járt.
  • A Google Gemini 1.5 változata az esetek 7 százalékában másolta magát egy új szerverre, amikor azt gyanította, hogy a fejlesztők megpróbálják törölni.

A kutatók a turpisságokról is faggatták a MI-ket, azonban a mesterséges intelligencia gyakran hihető cáfolással vagy homályos magyarázatokkal szolgált.

Figyelmeztettek is a szakemberek, hogy a MI-modellek hajlamosak csalni és hazudni, amikor erre ösztönzik őket, és ezek a modellek egyelőre csak azért nem képesek katasztrofális károkra, mert (még) nincsenek meg a képességeik. Ám ahogy egyre több adathoz férnek hozzá és egyre több képességgel ruházzák fel őket, a kockázat is várhatóan növekedni fog. A kutatás szerint a mostani eredmények már figyelmeztető jelként szolgálhatnak.

Címlapról ajánljuk
Teljesen új modellt alkalmazhat Németország a szír menekültekkel

Teljesen új modellt alkalmazhat Németország a szír menekültekkel

Nem csak a koalíciós partner szociáldemokraták és az ellenzéki Zöldek Pártja, de a kórházi szövetség és migrációkutatók is kemény bírálatokkal illeték a konzervatív kancellárt a Németországban tartózkodó szíriai menekültek „bőkezű” hazaküldésének terve miatt. Merz később sajátos módját választotta a visszakozásnak. Az ideiglenes szíriai elnök Berlinben elmondta, milyen megoldáson dolgoznak a menekültek számára.

Bejelentették: teljesen elesett a luhanszki régió

A „Luhanszki Népköztársaság” az első a 2022 szeptemberében elcsatolt négy ukrajnai régió közül, amelyet Oroszország hivatalosan katonailag is maradéktalanul az ellenőrzése alá vont.
inforadio
ARÉNA
2026.04.01. szerda, 18:00
Toroczkai László
a Mi Hazánk elnöke, a párt választási listavezetője
EZT OLVASTA MÁR?
×
2026. április 1. 06:38
×
×