Kina je navodno stvorila prvi AI na razini ljudi. Što pokazuju testovi?

U SVIJETU umjetne inteligencije, koji je posljednjih godina obilježen razvojem modela poput OpenAI-jevog ChatGPT-ja i Googleovog Geminija, kineski AI startup izazvao je globalnu senzaciju lansiranjem AI agenta Manus. Ovaj agent, koji su neki prozvali prvim istinskim autonomnim AI-jem, već je podigao veliku prašinu u tehnološkoj zajednici i izazvao rasprave o mogućem skorom dolasku opće umjetne inteligencije (AGI).
Što je Manus AI i tko stoji iza njega?
Manus je proizvod kineske tvrtke Butterfly Effect sa sjedištem u Wuhanu. Razvijen je pod vodstvom Yichao Jija, a predstavljen je kao prvi uistinu autonomni AI agent koji ne samo da može obrađivati jezične podatke kao što to mogu veliki jezični modeli, poput GPT-ja, već može samostalno izvršavati složene zadatke bez ljudskog nadzora.
Kreatori Manusa, AI modela lansiranog prošlog petka, tvrde da je sposoban samostalno obavljati složene zadatke poput rezervacije odmora, kupovine nekretnina ili stvaranja podcasta bez ikakvih ljudskih uputa.
Ji, predvodnik razvoja Manusa, tvrdi da on označava sljedeću fazu evolucije umjetne inteligencije i daje naslutiti kako bi mogla izgledati domena opće umjetne inteligencije (AGI) – AI sustava koji je sposoban nadmašiti ljudsku inteligenciju.
"Ovo nije samo još jedan chatbot ili alat za automatizaciju radnih procesa. Manus je uistinu autonomni agent koji premošćuje jaz između koncepta i realizacije", rekao je Ji u videu koji demonstrira mogućnosti AI modela.
"Dok se drugi AI modeli zaustavljaju na generiranju ideja, Manus isporučuje konkretne rezultate. Smatramo ga sljedećom paradigmom suradnje čovjeka i stroja", dodao je. Izvještaji sugeriraju da je razvoj Manusa financiran s više desetaka milijuna dolara, a samo nekoliko dana nakon lansiranja kodovi za rani pristup prodavali su se za oko 6300 funti.
Kako se Manus razlikuje od GPT-ja i drugih AI modela?
Za razliku od tradicionalnih jezičnih modela poput ChatGPT-ja, koji se prvenstveno temelje na generiranju teksta i konverzacijskim interakcijama, Manus djeluje kao autonomni agent sposoban za neovisno donošenje odluka i izvršavanje zadataka. Koristi kombinaciju više AI modela, uključujući prilagođene verzije Alibabinog Qwena i Anthropicovog Claude 3.5 Sonneta, kako bi poboljšao svoju učinkovitost i prilagodljivost.
Dok većina AI sustava zahtijeva eksplicitne korisničke upute za svaku fazu rada, Manus može samostalno prepoznati što treba učiniti i završiti zadatak.
Kao primjere nekih od njegovih sposobnosti kreatori navode:
- rezervacije putovanja i smještaja
- analize tržišta nekretnina i predlaganje najboljih investicijskih opcija
- pisanje i uređivanje složenih dokumenata i članaka
- stvaranje i uređivanje podcasta
- istraživanje internetskih izvora radi potrage za najnovijim i relevantnim informacijama o zadanoj temi.
AGI na horizontu?
Pojava Manusa ponovno je potaknula raspravu o tome koliko smo blizu postizanju opće umjetne inteligencije (AGI), koncepta AI sustava koji bi mogao nadmašiti ljudsku inteligenciju u većini kognitivnih zadataka.
Sam Altman, izvršni direktor OpenAI-ja, nedavno je izjavio da je "AGI na horizontu" te da bi mogao postati stvarnost brže nego što se očekivalo.
S njim se slaže i Dario Amodei, izvršni direktor Anthropica, koji procjenjuje da bi AGI mogao biti kreiran već 2026. godine. U eseju iz listopada 2024. Amodei je predvidio da će budući AI sustavi biti "pametniji od dobitnika Nobelove nagrade" i sposobni za zadatke koji uključuju donošenje odluka, upravljanje eksperimentima i analizu podataka na razini daleko iznad ljudske sposobnosti.
Međutim, unatoč velikim očekivanjima, rani testovi Manusa pokazuju da iako je iznimno moćan, i dalje nije bez mana, te još uvijek treba ljudsko vodstvo.
Prva testiranja Manusa
Zasad još nema mnogo ljudi koji su dobili pristup Manusu kako bi ga ispitali. Jedna od prvih kojima se pružila ta prilika je Caiwei Chen, istraživačica stranice MIT Technology Review. Kako bi procijenila stvarne mogućnosti modela, ona je provela testiranje u kojem mu je postavila tri zadatka:
- Sastavi popis najutjecajnijih novinara koji pokrivaju kinesku tehnološku industriju.
- Pronađi dvosobne stanove za najam u New Yorku prema precizno definiranim kriterijima.
- Predloži 50 kandidata za prestižnu listu Inovatori ispod 35 godina, koju svake godine objavljuje MIT Technology Review.
Što su pokazali rezultati?
Rezultati testiranja pokazali su da je Manus u prvom zadatku u početku dostavio nepotpun popis novinara sa samo pet imena. To je opravdao svojevrsnom lijenošću, odnosno naveo je da nije imao dovoljno vremena za potpuniju analizu. Kad je autorica testiranja od njega zatražila veću preciznost, proširio je popis na 30 imena i priložio detaljnije informacije.
Tijekom pretrage nekretnina inicijalno je previše doslovno interpretirao zahtjeve, pa je isključio opcije koje nisu imale privatni balkon ili terasu. Nakon dodatnih uputa generirao je korisniji popis.
Prilikom sastavljanja liste inovatora nakon tri sata pretrage internetskih izvora prikupio je samo tri potpuna profila. Kad je dobio dodatne smjernice, konačno je sastavio popis od 50 imena, ali s određenim nedostacima u raznolikosti izvora.
Nedostaci i izazovi
Autorica testiranja zaključila je da Manus unatoč obećavajućim rezultatima, još uvijek pati od određenih nedostataka. Naime, pokazalo se da se ponekad služi prečacima kako bi ubrzao obradu zadatka, što dovodi do površnih rezultata. Također se teško nosi s informacijama koje su zaključane iza paywallova i u akademskim časopisima. Konačno, kad se preoptereti, zna naići na tehničke probleme i padove sustava.
Unatoč zabilježenim nedostacima, Manus ima neke vrlo zanimljive aspekte, a to su prije svega transparentnost i interaktivnost – korisnici mogu pratiti svaki njegov korak i intervenirati ako primijete pogreške ili zastoje. Drugim riječima, moguće ga je usmjeravati još tijekom obavljanja zadataka.
Revolucija ili samo još jedan AI agent?
Manus predstavlja značajan korak u razvoju umjetne inteligencije, no i dalje nije na razini ljudske inteligencije. Ipak, njegova sposobnost da samostalno rješava složene zadatke, u kombinaciji s njegovim autonomnim djelovanjem, sugerira da idemo prema sve naprednijim AI agentima, koji bi mogli transformirati način na koji ljudi surađuju sa strojevima.
Dok neki AI stručnjaci predviđaju da bi AGI mogao postati stvarnost u sljedećih nekoliko godina, skeptici upozoravaju da još uvijek ne postoje čvrsti dokazi da je ijedan AI model dosegnuo razinu opće inteligencije.

bi Vas mogao zanimati
Izdvojeno
Pročitajte još
bi Vas mogao zanimati