The Washington Post: Ljudi sve više govore poput ChatGPT-a

AKO KORISTITE ChatGPT, Claude, Gemini ili neki drugi chatbot pokretan umjetnom inteligencijom, vjerojatno polazite od pretpostavke da oboje govorite istim jezikom. Vi unosite engleski jezik, chatbot odgovara na engleskom. Jednostavno, zar ne? Osim što je to zabluda: zapravo ste govorili različitim jezicima.
Umjesto da obrađuje tekst kao čovjek, chatbot pretvara vaš upit u takozvani embedding, odnosno ugradnja ili vektorski prikaz - skup brojeva predstavljen u "vektorskom prostoru", nešto poput koordinata na karti. Ali kao što je karta spljošten prikaz pravog teritorija, tako je i to embedding spljošten prikaz jezika; određena količina ljudske varijacije i konteksta nužno se gubi.
Izgleda kao engleski, ali zapravo je simulakrum
Zatim chatbot formulira odgovor, izvodeći predviđanje riječ po riječ na temelju načina na koji je treniran da odgovara na prethodne unose. To predviđanje počiva na pristranim podacima za učenje, specifičnim tekstovima iz kojih uči.
Kao i na pristranom učenju potkrjepljivanjem, povratnim informacijama koje dobiva. U konačnici, ono što vama izgleda kao engleski zapravo je simulakrum (simulacija bez izvornika ili originala) stvarnog ljudskog govora.
Zabrinjavajuće je to što sada, kad se stotine milijuna ljudi redovito upuštaju u razgovor s chatbotovima, ljudi koji govore engleski počinju zvučati poput neljudskog komunikatora, za The Washington Post piše Adam Aleksic, američki lingvist i autor knjige "Algospeak: How Social Media Is Transforming the Future of Language" (Algospeak: Kako društveni mediji mijenjaju budućnost jezika).
Na primjer, ChatGPT koristi riječ "delve" (temeljito istraživati/zagrebati dublje u nešto) s većom učestalošću nego što je ljudi općenito koriste pri pisanju ili govoru engleskog. Kako su utvrdili istraživači sa Sveučilišta Florida State, Tom S. Juzek i Zina B. Ward, to vjerojatno proizlazi iz malih pristranosti i pogrešaka u procesu ljudskih povratnih informacija koje se s vremenom povećavaju.
Posljedica zapošljavanja iz Nigerije ili Kenije
Zaposlenici AI tvrtki koji provjeravaju ishode velikih jezičnih modela (LLM-ova) često su slabo plaćeni radnici iz zemalja poput Nigerije i Kenije, gdje se "delve" koristi učestalije nego u američkom ili britanskom engleskom.
Takve blage leksičke prezastupljenosti stoga su možda bile ojačane u modelu, ponekad čak i češće nego u vlastitoj upotrebi tih radnika. Zbog vremenskog pritiska posla i stresnih uvjeta, provjeravatelji su možda previdjeli učestalost "delve" dok su klikali kroz uzorke tekstova, što je dovelo do dodatnog pojačanja. Neki drugi primjeri su "intricate" (zamršeno/složeno), "commendable" (hvalevrijedno/pohvalno) i "meticulous" (pedantno/pomno).
Sada se ta pretjerana upotreba prelijeva u globalnu kulturu. U dvije godine otkako je ChatGPT pokrenut krajem 2022. godine, pojava "delve" u akademskom izdavaštvu porasla je deseterostruko kako su se istraživači počeli okretati umjetnoj inteligenciji za pomoć pri svojim radovima.
Kako su znanstvenici i pisci postali svjesniji tog fenomena, poduzeli su korake kako bi "zvučali manje kao umjetna inteligencija". I ja sam zapravo uživao koristiti riječ "delve"; sada je nastojim izbjegavati, ističe Aleksic.
Većina ljudi nije svjesna pristranosti chatbota
Ali većina ljudi vjerojatno ne zna za pristranosti chatbota prema određenim riječima. Korisnici pretpostavljaju da ChatGPT govori "normalnim" engleskim jer to sugerira korisničko sučelje alata.
Također pretpostavljaju da su uobičajeni, svakodnevni tekstovi na koje nailaze normalan engleski, čak i kada su možda također generirani umjetnom inteligencijom. S vremenom postaje sve lakše pomiješati prikaz sa stvarnošću.
Doista, jedno istraživanje o kojem je prošlog mjeseca izvijestio Scientific American pokazalo je da su ljudi počeli češće izgovarati "delve" u spontanim, usmenim razgovorima. To više nije djelo umjetne inteligencije; počeli smo internalizirati njezine pristranosti i sami ih ponavljati.
Kažem "mi" jer čak ni oni koji su u "anti-delve" frakciji nisu izuzeti. Možda izbjegavamo koristiti najpoznatije znakove ChatGPT-a, ali toliko se riječi pojavljuje s neprirodnom učestalošću da ih jednostavno ne možemo sve izbjeći. Trebamo li također prestati koristiti od chatbota pretjerano korišteni "inquiry" (upit/istraga)? Ili "surpass" (nadmašiti/premašiti)? Previše je toga da bismo sve pratili.
Nesvjesno usvajanje rječnika LLM-ova
Naša podložnost nesvjesnom usvajanju rječnika LLM-ova vjerojatno će samo rasti kako se krug AI teksta, ljudskog teksta za koji ne znamo da je AI, i stvarnog ljudskog govora bude okretao sve brže i brže. U psiholingvistici je općenito prihvaćeno da učestalost prikazivanja neke riječi utječe na njezinu dostupnost u mentalnom leksikonu ljudi - "rječniku" mogućih opcija iz kojeg se crpi u usmenoj komunikaciji.
Ukratko, što neku riječ češće vidimo, to nam se intuitivnijom čini koristiti je i sami.
Normalno je da se naše mentalne jezične mape mijenjaju, ali sada smo u povratnoj petlji u kojoj se naše "mape" približavaju "mapama" chatbotova.
Obje se razlikuju od stvarnog krajolika - nezamislive raznolikosti načina na koji ljudi govore - ali ta zbrka otežava procjenu što je doista ljudski jezik, a što je umjetno generirano.
Kako ovu razliku postaje sve teže razlučiti, nastavit ćemo zamućivati granice stvarnosti, ciklički koristeći tu zamućenost za konstruiranje naših novih stvarnosti. I kako se AI modeli nastave trenirati i na vlastitim izlazima i na ljudskom pisanju pod utjecajem umjetne inteligencije koje unose, raširenost LLM-govora samo će se pojačavati.
Jezik je vjesnik većih društvenih pomaka
S lingvističkog stajališta, u ovome nema ništa pogrešno. Riječ "delve" nije ništa lošija za mozak od svojih sinonima. No jezik je navjestitelj većih društvenih pomaka. Postoji mnogo drugih, daleko podmuklijih iskrivljenih prikaza koji su također ugrađeni u LLM-ove.
Rasne, rodne i političke pristranosti - sve su one vjerojatno u modelima istrenirane slično kao i jezične pristranosti, ali ove je teže definitivno izmjeriti. Moramo imati na umu da to nisu neutralni alati: oni imaju moć suptilno preoblikovati naše razmišljanje.

bi Vas mogao zanimati
Izdvojeno
Pročitajte još
bi Vas mogao zanimati