Snimi fotografiju, napiši par rečenica i pritisni Enter. Za nekoliko sekundi dobije se gotov video - sa zvukom, specijalnim efektima i dijalozima. Google je u aplikaciji Gemini predstavio novu funkciju koja pretplatnicima omogućuje da iz statične slike stvore 8-sekundni video. Dovoljno je učitati fotografiju, dodati kratak opis, a Googleov model Veo 3 automatski generira kratku animiranu sekvencu.
Funkcija je dostupna korisnicima paketa Google AI Pro (19.99 USD mjesečno) i Ultra (249.99 USD mjesečno) i predstavlja još jedan korak prema dubljoj integraciji umjetne inteligencije u videoprodukciju. Kreativna revolucija? Možda. Ali i minsko polje rizika – od autorskih prava, preko deepfakeova, do dezinformacija, piše Fanpage.it.
Za korištenje nove opcije u Geminiju dovoljno je iz izbornika odabrati "video", učitati fotografiju i opisati željene pokrete. Ako je riječ o ljudima na slici, korisnik može zadati i konkretne radnje ili dijaloge; za pejzaže i ambijente moguće je dodati maštovite detalje poput neuobičajenih vremenskih pojava ili fantastičnih objekata.
Moguće je i opisati zvuk kako bi se prilagodili dijalozi i efekti, a generirani video stiže u formatu 16:9 (MP4) i rezoluciji 720p. Stvaranje je vrlo jednostavno, ali nadzor nad takvim sadržajem mogao bi postati izrazito složen.
Da bi se trenirali, AI video-generatori trebaju goleme skupove podataka – slike, videozapise, tekstove i zvukove. Usprkos povremenim vizualnim manama (čudni ili nedosljedni detalji), rezultat je često vrlo uvjerljiv, pa je sve teže razlikovati AI video od stvarnog zapisa.
Brzi napredak tih tehnologija donosi i probleme. AI video može širiti lažne vijesti, kršiti autorska prava i otvoriti brojne etičke dileme. Dovoljno je prisjetiti se seksualnih deepfakeova napravljenih bez pristanka žrtve – fenomena koji raste zahvaljujući lako dostupnim besplatnim AI alatima sposobnima za iznimno realistične prikaze.
Google se nastoji preventivno zaštititi. Tvrtka navodi da će Gemini na svaki video staviti vidljivu oznaku o umjetnom podrijetlu i nevidljivi digitalni žig SynthID, a sadržaji s eksplicitnom seksualnom tematikom bit će filtrirani. Iz kompanije poručuju da je cilj funkcije potaknuti kreativnost običnih korisnika, a ne zamijeniti profesionalce.
No, to možda neće biti dovoljno. "Ne mogu nas umiriti nejasna jamstva o sigurnosti sustava", upozorava Miranda Bogen, direktorica AI Governance Laba pri Center for Democracy and Technology za Washington Post.
"Danas su zaštite nedostatne jer mnoge se tvrtke utrkuju u lansiranju vrhunskih alata bez odgovarajućih sigurnosnih provjera", dodaje. Prema Bogen, kriminalci bi takve alate mogli iskoristiti za širenje govora mržnje, internetske prijevare i dezinformacije.