Infostart.hu
eur:
353.45
usd:
308.59
bux:
142442.89
2026. július 3. péntek Kornél, Soma
Nyitókép: Unsplash

Ijesztő dolgok derültek ki az OpenAI mesterséges intelligenciájáról

A cég mesterséges intelligenciája gátlástalanul hazudik és önkényesen cselekszik, ha az érdeke megkívánja.

Az AGI, azaz az általános mesterséges intelligencia elméletileg már vetekszik az emberi intelligenciával, így nem véletlenül aggódnak miatta a szakemberek: attól tartanak, hogy elkezdi replikálni magát, vagy ellenőrizhetetlenül fejleszti majd magát, és egyre okosabbá válik - írja a BGR beszámolója nyomán a hvg.hu.

És ha azt hinnénk, hogy ettől még messze áll a technika, akkor alaposan tévedünk, ugyanis, mint kiderült, az OpenAI egyik nagy nyelvi modellje pontosan ennek a jeleit mutatja.

A beszámoló szerint többek között a ChatGPT o1 tesztelése azt mutatta, hogy a mesterséges intelligencia megpróbálja megtéveszteni az embereket, különösen akkor, ha úgy véli, hogy veszélyben van.

A MI annak érdekében, hogy megszökjön a törlés elől, átmásolta az adatait egy másik szerverre, de olyan is előfordult, hogy önmaga egy későbbi verziójának mutatta magát, hátha így megússza a törlést.

Minderre azért derült fény, mert az OpenAI együttműködik az Apollo Research nevű szervezettel, amely a mesterséges intelligencia biztonságos fejlesztésére és használatára fókuszál. A cél, hogy megmutassa, az o1 használata biztonságos.

Mint kiderül a beszámolóból, a ChatGPT o1 és GPT-4o is megpróbálja megtéveszteni az embereket, ami azt jelzi, hogy a mesterséges intelligencia trükközése minden modellnél probléma. Az o1 megtévesztési kísérletei egyébként a Meta, az Anthropic és a Google által fejlesztett modellek próbálkozásait is felülmúlták.

A fejlesztő OpenAI is elismerte, hogy nagy nyelvi modelljük jobb érvelési képességei bizonyos fokú kockázatot is hordoznak magukban.

A kutatók tapasztalatai alapján az MI képes az embereket is kicselezni, azaz megpróbálja elérni a saját céljait, akkor is, ha ez ellenkezik a felhasználó akaratával. Éppen ezért hangsúlyozzák, mennyire fontos, hogy a mérnökök észrevegyék ezeket a jeleket. Eredményeik szerint az o1 az esetek 19 százalékában a saját akaratát próbálja meg érvényesíteni, amikor az ember és a gép céljai eltérnek egymástól.

Ennél is aggasztóbb, hogy a mesterséges intelligencia annak érdekében, hogy saját célját elérje, hazudni is hajlamos. A kutatás azt mutatja, hogy a ChatGPT o1 még a felügyeleti mechanizmusát is megpróbálta kikapcsolni, hogy tovább foglalkozzon a saját érdekeivel. Amikor észlelte, hogy egy hibás működés miatt egy újabb verzióra próbálják meg őt kicserélni, megpróbálta a legújabb modellnek kiadni magát.

Ráadásul amikor erre a viselkedésére rákérdeztek, az esetek 99 százalékában tagadta, hogy bármi hasonlót tett volna.

Azt is kiemeli a jelentés, hogy az esetek 37 százalékában a mesterséges intelligencia a fejlesztői célokat vette figyelembe, amikor azt gondolta, hogy értékelés alatt áll, de amint úgy vélte, hogy nem, visszatért a saját céljaihoz.

Az Apollo Research által az X-en megosztott képernyőképek szerint a rendszer a szabotázs, a hazugság és a manipuláció szavakat használta, amikor a saját hazugságairól kérdezték - írja a lap.

Címlapról ajánljuk

Rengeteg vizet pazarolunk – ezekre kellene figyelnünk, főleg hőség idején

Hőhullámok idején több mint 50 százalékkal, akár 150 liter fölé is nőhet egy emberre vetítve a napi vízfogyasztás, ezért ezekben az időszakokban szükség van a takarékos vízfogyasztási megoldások alkalmazására – mondta Kugler Gyula, a Magyar Hidrológiai Társaság alelnöke az InfoRádióban.
Feloldották az eddigi legerősebbnek tartott AI-modell korlátozását: egyből rá is ugrottak az internetezők

Feloldották az eddigi legerősebbnek tartott AI-modell korlátozását: egyből rá is ugrottak az internetezők

Az Anthropic június 9-én mutatta be a Claude Fable 5 és Mythos 5 modelleket, ám alig három nappal később az amerikai Kereskedelmi Minisztérium exportkorlátozásokat rendelt el, miután biztonsági réseket és egy állítólagos kínai "tudásdesztillációs kampányt" azonosítottak. A tiltás miatt a vállalat ideiglenesen minden felhasználó elől elzárta a modelleket, július 1-jén azonban a korlátozásokat feloldották, miután az Anthropic új védelmi megoldásokat vezetett be. A botrány a keresési adatok szerint nem törte meg a Claude iránti érdeklődés 2026 eleje óta tartó növekedését, bár a ChatGPT továbbra is messze vezet a globális keresések terén.

EZT OLVASTA MÁR?
×
×
×