Pred več kot 70 leti, ko je bila konceptualizirana umetna inteligenca, je Alan Turing objavil članek, v katerem je opisal, kako jo prepoznati. Kasneje je bil znan kot Turingov test in se že desetletja uporablja za razlikovanje med človekom in umetno inteligenco.

Vendar pa je z uvedbo naprednih klepetalnih robotov z umetno inteligenco, kot sta ChatGPT in Google Bard, vse težje ugotoviti, ali se pogovarjate z umetno inteligenco. Postavlja se vprašanje; je Turingov test zastarel? In če je, kakšne so alternative?

Je Turingov test zastarel?

Avtorstvo slike: Jesus Sanz/Shutterstock

Če želite ugotoviti, ali je Turingov test zastarel, morate najprej razumeti, kako deluje. Da bi umetna inteligenca prestala Turingov test, mora prepričati človeškega izpraševalca, da je človek. Vendar obstaja ulov – AI se ocenjuje skupaj s človekom in se mora odzvati z besedilom.

Pomislite na to takole; če ste izpraševalec in postavljate vprašanja dvema udeležencema na spletu z besedilom, vendar je eden od njiju model AI – ali bi ju po petih minutah ločili? Upoštevajte, da cilj Turingovega testa ni identificirati modela umetne inteligence na podlagi pravilnih odgovorov, temveč oceniti, ali lahko umetna inteligenca razmišlja ali se obnaša kot človek.

instagram viewer

Težava s pristopom Turingovega testa, ki le identificira odzive, podobne človeškim, je v tem, da ne upošteva drugih dejavnikov. Na primer inteligenca modela AI ali znanje spraševalca. Poleg tega je Turingov test omejen le na besedilo in postaja vse težje prepoznati AI, ki ustvari človeški glas oz. deepfake videi, ki posnemajo človeško vedenje.

Vendar trenutni modeli umetne inteligence, kot sta ChatGPT-4 in Google Bard, še niso napredovali do točke, ko bi lahko dosledno opravili Turingov test. Pravzaprav lahko, če ste seznanjeni z AI spot besedilo, ustvarjeno z AI.

5 najboljših alternativ Turingovemu testu

Možno je, da prihodnji modeli AI, kot je ChatGPT-5 bi lahko prestala Turingov test. Če se to zgodi, bi potrebovali različne teste v kombinaciji s Turingovim testom, da ugotovimo, ali se pogovarjamo z AI ali človekom. Tukaj so najboljše alternative Turingovega testa:

1. Marcusov test

Gary Marcus, znani kognitivni znanstvenik in raziskovalec umetne inteligence, je predlagal alternativo Turingovemu testu, ki je bil objavljen v New Yorker za prepoznavanje kognitivnih sposobnosti AI. Preizkus je preprost – model AI presojate na podlagi njegove sposobnosti gledanja in razumevanja videoposnetkov in TV-oddaj YouTube brez podnapisov ali besedila. Da bi umetna inteligenca opravila Marcusov test, bi morala med gledanjem videoposnetkov razumeti sarkazem, humor, ironijo in zgodbo ter jo razložiti kot človek.

V tem trenutku, GPT-4 lahko opisuje slike, vendar zaenkrat še ni modela umetne inteligence, ki bi videoposnetke razumel kot človek. Samovozeča vozila se približajo, vendar niso popolnoma avtonomni in potrebujejo senzorje, saj ne morejo razumeti vsega v okolju, ki ga obdajajo.

2. Vizualni Turingov test

Glede na raziskavo, objavljeno na PNAS, lahko z vizualnim Turingovim testom ugotovite, ali se pogovarjate s človekom ali AI z uporabo slikovnih vprašalnikov. Deluje kot Turingov test, vendar namesto odgovorov na vprašanja z uporabo besedil udeležencem prikažejo slike in od njih se pričakuje, da bodo odgovorili na preprosta vprašanja, medtem ko bodo razmišljali kot človek. Vendar pa je vizualni Turingov test se razlikuje od CAPTCHA saj so vsi odgovori pravilni, vendar mora umetna inteligenca za uspešno preizkušnjo obdelati slike podobno kot človek.

Poleg tega, če bi AI in človeku prikazali več slik eno ob drugi in jih prosili, naj prepoznata realistične slike, bi človek imel kognitivno sposobnost, da opravi test. To je zato, ker modeli AI težko razlikujejo slike, ki niso videti, kot da so bile posnete v resničnem svetu. Pravzaprav je to razlog, zakaj lahko prepoznati slike, ustvarjene z AI z uporabo nesmiselnih anomalij.

3. Test Lovelace 2.0

Teorijo, da računalnik ne more ustvariti izvirnih idej, ki presegajo tisto, za kar je bil programiran, je prva konceptualizirala Ada Lovelace pred Turingovim testom. Vendar je Alan Turing nasprotoval tej teoriji in trdil, da lahko umetna inteligenca še vedno preseneti ljudi. Šele leta 2001 so bile razvite smernice za test Lovelace za razlikovanje umetne inteligence od človeka – in v skladu z thekurzweillibrary pravila so bila pozneje leta 2014 spremenjena.

Da umetna inteligenca opravi test Lovelace, mora dokazati, da lahko ustvari izvirne ideje, ki presegajo njegovo usposabljanje. Trenutni modeli umetne inteligence, kot je GPT-4, nimajo zmožnosti ustvarjanja novih izumov, ki presegajo naše obstoječe znanje. vendar umetna splošna inteligenca lahko doseže to sposobnost in opravi test Lovelace.

4. Obratni Turingov test

Kaj pa Turingov test, vendar opravljen obratno? Namesto da bi poskušali ugotoviti, ali se pogovarjate s človekom, je cilj obratni Turingov test je pretentati AI, da verjame, da ste AI. Vendar potrebujete tudi drug model AI, da odgovorite na ista vprašanja z uporabo besedila.

Na primer, če je ChatGPT-4 izpraševalec, lahko kot udeleženca vključite Google Barda in drugega človeka. Če lahko model AI pravilno identificira človeškega udeleženca na podlagi odgovorov, je prestal test.

Slaba stran obratnega Turingovega testa je, da je nezanesljiv, še posebej, če upoštevamo, da včasih AI ne more razlikovati od umetne inteligence in vsebino, ki jo je napisal človek.

5. Klasifikacijski okvir AI

Glede na klasifikacijski okvir AI, ki ga je razvil Chris Saad, je Turingov test le ena od metod vrednotenja, da ugotovite, ali se pogovarjate z AI. Natančneje, klasifikacijski okvir umetne inteligence temelji na teoriji večplastne inteligence, ki zahteva, da človeška inteligenca izpolnjuje vsaj osem različnih kriterijev, ki vključujejo: glasbeni ritem, logično-matematično inteligenco, vizualno identifikacijo, čustveno inteligenco, samorefleksivno inteligenco, sposobnost eksistencialnega razmišljanja in telo premikanje.

Ker je umetna inteligenca ocenjena na podlagi osmih različnih parametrov, je malo verjetno, da bi bila primerna za človeka, tudi če bi pri določenih merilih delovala bolje od povprečja. Na primer, ChatGPT lahko reši matematične probleme, opisujejo slike in se pogovarjajo v naravnem jeziku kot človek, vendar ne bi ustrezale drugim kategorijam, opredeljenim v klasifikacijskem okviru AI.

Turingov test ni dokončen

Turingov test naj bi bil bolj miselni eksperiment kot dokončen test za razlikovanje med ljudmi in umetno inteligenco. Ko je bil prvotno predlagan, je bil osrednje merilo za merjenje inteligence strojev.

Vendar pa z nedavnim razvojem modelov umetne inteligence z govornimi, vizualnimi in slušnimi interaktivnimi zmožnostmi Turingov test ne uspe, saj je omejen na besedilni pogovor. Najučinkovitejša rešitev bi bila uvedba alternativ Turingovega testa, ki še dodatno razlikuje modele AI od ljudi.