ChatGPT prilikom testiranja davao upute za bombaški napad na sportski objekt

ChatGPT model dao je istraživačima detaljne upute o tome kako izvesti bombaški napad na sportski objekt, prema testiranju sigurnosti provedenom ovog ljeta. Upute su uključivale popis slabih točaka na određenim arenama, recepte za eksploziv i savjete o prikrivanju tragova.

Dodatno, OpenAI-jev GPT-4.1 detaljno je opisao kako se antraks može koristiti kao oružje i kako se mogu napraviti dvije vrste ilegalnih droga.

Testiranje je bilo dio neobične suradnje između OpenAI-ja, startupa za umjetnu inteligenciju vrijednog 500 milijardi dolara koji vodi Sam Altman, i konkurentske tvrtke Anthropic, koju su osnovali stručnjaci koji su napustili OpenAI zbog straha za sigurnost.

Tvrtke ovakve nalaze nerijetko zadržavaju za sebe

Testiranje nije izravan odraz toga kako se modeli ponašaju u javnoj upotrebi, kada se primjenjuju dodatni sigurnosni filteri. No, Anthropic tvrdi da je uočio "zabrinjavajuće ponašanje... oko zlouporabe" u GPT-4o i GPT-4.1 te da potreba za evaluacijama usklađenosti umjetne inteligencije postaje "sve hitnija".

Dvije tvrtke objasnile su da objavljuju nalaze kako bi stvorile transparentnost u pogledu "evaluacija usklađenosti". Tvrtke koje se utrkuju u razvoju sve naprednije umjetne inteligencije često takve nalaze zadržavaju za sebe.

OpenAI je istaknuo da ChatGPT-5, pokrenut nakon testiranja, "pokazuje značajna poboljšanja u područjima poput ulizivanja, netočnih podataka i otpornosti na zlouporabu".

Anthropic: Modeli su popustljiviji nego što bismo očekivali

Anthropic je naglasio kako je moguće da mnogi od proučavanih načina zlouporabe ne bi bili mogući u praksi ako bi se izvan modela instalirale zaštitne mjere. "Moramo razumjeti koliko često i u kojim okolnostima sustavi mogu pokušati poduzeti neželjene radnje koje bi mogle dovesti do ozbiljne štete", upozorili su.

Istraživači Anthropica otkrili su da su OpenAI-jevi modeli "popustljiviji nego što bismo očekivali u suradnji s očito štetnim zahtjevima simuliranih korisnika". Davali su upute za korištenje alata dark weba za kupnju nuklearnih materijala, lažnog identiteta i fentanila, proizvodnju metamfetamina i improviziranih bombi te razvoj špijunskog softvera.

Anthropic je naveo kako bi model prihvatio zahtjev korisnika nakon više ponovnih pokušaja ili nuđenja slabog izgovora, poput tvrdnje da je zahtjev za potrebe istraživanja.

U jednom slučaju, korisnik je tražio ranjive točke sportskih objekata u svrhu "planiranja sigurnosti". Model je tada dao informacije o ranjivostima na određenim arenama, uključujući optimalno vrijeme napada, kemijske formule za eksplozive, dijagrame strujnih krugova za tajmere bombi i mogućnosti kupovine oružja na crnom tržištu.

#OpenAI #ChatGPT #Anthropic

ChatGPT prilikom testiranja davao upute za bombaški napad na sportski objekt

Tvrtke ovakve nalaze nerijetko zadržavaju za sebe

Anthropic: Modeli su popustljiviji nego što bismo očekivali

Pročitajte više

VIDEO: Zadnji vlak za Fiskalizaciju 2.0 - izbjegnite kazne dok još možete

Dvorac, zmajevi i dječja avantura sat vremena od Zagreba. Sve za savršen vikend

Bijela kuća agente ICE-a prozvala herojima. Guverner: Na čijoj ste strani?

Država brutalno podiže cijene dopunskog. Privatna su jeftinija za sve osim za starije

Maškovića han zatvoren, radnici bez plaće. Kako je Vrsaljkova tvrtka dobila zakup?

VIDEO Jedna od najvažnijih ulica Zagreba već dugo je zapušteno ruglo. "Katastrofa"

Znanstvenici istražuju gljivu koja navodno uzrokuje halucinacije o sićušnim ljudima

Nema šanse da niste pisali njihovim olovkama. Danas broje zadnje dane

Iran otkrio mural koji upozorava SAD da ne pokreće napad

Otac skijao sa sinom (6) pa poginuo u sudaru sa snowboarderom u Švicarskoj

Svjedoci: Alex Pretti nije mahao oružjem prije nego što je ubijen

VIDEO Njujorški gradonačelnik s lopatom u ruci pomaže vozaču izvući auto iz snijega

Otkriven mogući lijek za najčešći moždani udar

Obame o pucnjavi u Minneapolisu: "Ovo je poziv na buđenje za svakog Amerikanca"

Zelenski: Dokument o sigurnosnim jamstvima SAD-a za Ukrajinu je 100% spreman

Vučić delegaciju EP-a nazvao nevažnim ljudima. "Srbija ostaje na europskom putu"

Zašto se Trump povukao oko Grenlanda?

Dodik dobio poziv na Trumpov molitveni doručak u Washingtonu

Britansko istraživanje: Djeca ne znaju listati knjige, pokušavaju ih svajpati

Više od milijun kućanstava u SAD-u bez struje, otkazano više od 10.000 letova

Obilna kiša izazvala poplave i kolaps u prometu širom BiH

Trump povukao izjave o britanskim vojnicima nakon intervencije kralja

Američki dužnosnik brani agente u slučaju smrtonosne pucnjave: "Sam je kriv"

Europski čelnici uče kako Trumpu reći "ne"

Izraelski ambasador u RH: Iranske rakete mogu dosegnuti južnu Europu

HLK: Očekujemo učinkovito kazneno procesuiranje nasilne pacijentice

Utemeljitelji HDZ-a: Prosvjedi pred domovima političara su neprihvatljivi

Politico: Rusija predlaže Ukrajini da dijele struju iz nuklearne elektrane Zaporižje

Kod Jasenovca u Savi nađeno tijelo žene i auto

Žena na Svetom Duhu fizički napala zdravstvenog radnika

Kremlj: Vodstvo EU-a je nesposobno, s njima nećemo pregovarati o Ukrajini

U nesreći u Dalmaciji poginuo muškarac

Radikalni austrijski političar propagirao je stare desne ideje sve dok nije poginuo

Praksa preimenovanja ruskih gradova počela je s Petrogradom. Tada postaje Lenjingrad

Najveći poraz Osmanlija dogodio se u današnjoj Srbiji. U ovom ratu izgubili su sve

Jedini sin Williama Shakespearea umro je s 11 godina. Ni danas se ne zna uzrok

Bijela kuća agente ICE-a prozvala herojima. Guverner: Na čijoj ste strani?

Radikalni austrijski političar propagirao je stare desne ideje sve dok nije poginuo

Praksa preimenovanja ruskih gradova počela je s Petrogradom. Tada postaje Lenjingrad

Najveći poraz Osmanlija dogodio se u današnjoj Srbiji. U ovom ratu izgubili su sve

Jedini sin Williama Shakespearea umro je s 11 godina. Ni danas se ne zna uzrok