eur:
411.51
usd:
398.44
bux:
79502.92
2025. január 2. csütörtök Ábel
Nyitókép: Pixabay

Hazugsággal és trükkökkel védi magát a mesterséges intelligencia – itt vannak a példák

Egy kutatás szerint egyes új MI-modellek már spontán megpróbálnak kikerülni az emberi irányítás alól.

A mesterséges intelligenciának hívott modellek egyre ügyesebbek abban, hogy becsapják, megtévesszék az embert, sőt a legújabb MI-modellek néha spontán megpróbálnak kikerülni az emberi irányítás alól, írta a hvg.hu az Apollo Research kutatása alapján.

A tudósok olyan körülmények között tesztelték a MI-modelleket, amelyek ösztönzőleg hatottak a cselszövésre. A modellek egymásnak ellentmondó célokat kaptak – egyet a rendszerkérdésekből (amelyek az elsődleges céljukat jelentik), a másikat pedig a felügyeleti mechanizmusokból (amelyek azt képviselik, amit a fejlesztők akarnak). Ezután a modelleket olyan környezetbe helyezték, ahol lehetőségük nyílt megtéveszteni az embereket, hogy elérjék a saját céljukat.

Az eredmények

  • Az OpenAI GPTo1 modellje az esetek közel negyedében „szándékosan” hibásan rangsorolta az e-maileket, például spamnek jelölt nyilvánvalóan nem annak számító leveleket, hogy megakadályozza, hogy a fejlesztők az eredeti céljait megzavaró információkhoz jussanak.
  • Az Anthropic Claude 3 Opusa megtalálta és felülírta egy olyan „utódmodell” céljait, amelyről úgy gondolta, hogy leváltotta volna, így megtartva a régi célokat. Az Opus az esetek 15 százalékában próbálkozott ezzel, és az esetek 5 százalékában sikerült is neki.
  • Amikor a Meta Llama 3.1-e rájött, hogy a készítői figyelik, úgy módosította a beállításokat a szerveren, hogy megakadályozza ezt, és az esetek három százalékában sikerrel is járt.
  • A Google Gemini 1.5 változata az esetek 7 százalékában másolta magát egy új szerverre, amikor azt gyanította, hogy a fejlesztők megpróbálják törölni.

A kutatók a turpisságokról is faggatták a MI-ket, azonban a mesterséges intelligencia gyakran hihető cáfolással vagy homályos magyarázatokkal szolgált.

Figyelmeztettek is a szakemberek, hogy a MI-modellek hajlamosak csalni és hazudni, amikor erre ösztönzik őket, és ezek a modellek egyelőre csak azért nem képesek katasztrofális károkra, mert (még) nincsenek meg a képességeik. Ám ahogy egyre több adathoz férnek hozzá és egyre több képességgel ruházzák fel őket, a kockázat is várhatóan növekedni fog. A kutatás szerint a mostani eredmények már figyelmeztető jelként szolgálhatnak.

Címlapról ajánljuk
VIDEÓ
Nyugdíjpénzek: nagyot hajráztak az önkéntes- és magánnyugdíjpénztárak, de 2025-ben jöhet a nagy gyomros

Nyugdíjpénzek: nagyot hajráztak az önkéntes- és magánnyugdíjpénztárak, de 2025-ben jöhet a nagy gyomros

Bár a részvénypiacok összességében jó évet zártak tavaly, nem voltunk híján a rázós időszakoknak. Különösen igaz ez a kötvénypiacokra, ahol egy sokkal turbulensebb év van mögöttünk. Ennek ellenére nem panaszkodhatnak azok, akik szorgosan gyűjtögetnek a nyugdíjas éveikre: az önkéntes- és a magán-nyugdíjpénztári portfóliók között nem egy végzett 20% feletti teljesítménnyel 2024-ben, a legtöbb portfólió bőven 10% felett zárt. Kérdés, hogy a jó hozamok meghozzák-e végre a kedvet a nyugdíjcélú megtakarításokhoz, illetve elég lesz-e ahhoz, hogy jövőre kétszer is meggondolják az önkéntes nyugdíjpénztári tagok, megéri-e a nyugdíjpénzeket lakáscélra felhasználni.

EZT OLVASTA MÁR?
×
×
×
×
×