Čeprav je ChatGPT eden najbolj priljubljenih klepetalnih robotov z umetno inteligenco, morda ni več najboljši. Claude AI ponuja nekatere funkcije, ki presegajo GPT. Toda kateri je boljši?

Od izdaje novembra 2022 je ChatGPT ostal prevladujoča sila v prostoru klepetalnih botov z umetno inteligenco. Kljub daljnosežnim prizadevanjem več podjetij z umetno inteligenco še nikomur ni uspelo zgraditi chatbota, ki bi resnično izzval ChatGPT v splošni kakovosti odziva. Googlov Bard? Microsoftov Bing AI? Ne, res ne.

Vendar pa Claude AI, klepetalni robot, ki ga je izdelal startup AI Anthropic, kaže lastnosti klepetalnega bota, ki lahko vrže ChatGPT s prestola. Precejšnje število uporabnikov že pravi, da je Claude boljša možnost. Toda ali je temu tako? Oglejmo si oba chatbota.

ChatGPT vs. Claude AI: Zdrava pamet in logično sklepanje

Pri delu s klepetalnimi roboti AI je zanimiv kontrast. Po eni strani lahko premlevajo zapletene naloge, za reševanje katerih se ljudje trudijo več dni. Po drugi strani pa se včasih ubadajo z elementarnimi težavami, ki zahtevajo le kanček zdrave pameti ali logičnega razmišljanja. Tako smo preizkusili ChatGPT in Claude AI, da bi ugotovili, kateri klepetalni robot AI je boljši pri nalogah zdrave pameti in logičnega sklepanja.

ChatGPT je težavo razdelil na koščke in jo rešil v prvem poskusu. Tudi Claude AI je poskusil in prav tako rešil težavo, vendar z drugačnim pristopom.

Pri prvi nalogi sta oba chatbota uspela razbiti težavo. Tako smo prešli na drugo vrsto problema. Oba chatbota smo zadolžili, da odgovorita na trik vprašanje.

ChatGPT je lahko takoj opazil trik - preživelih ne morete pokopati, ker niso mrtvi. Po drugi strani pa se je zdelo, da je Claude AI razumel, da gre za trik vprašanje, vendar ni opazil najbolj zdravorazumskega vprašanja, da preživelih ne pokoplješ.

Namesto tega je preveč analiziral vprašanje in prišel do zaključka, da "ne bo preživelih, ki bi jih lahko pokopali", ker bi bilo strmoglavljenje z Marsa na Zemljo usodno. To ni odgovor, ki smo ga pričakovali, a če stvari pogledate z drugega zornega kota, je v njem nekaj resnice.

Za to nalogo jo damo ChatGPT, vendar ne moremo popolnoma izključiti pristopa Clauda AI. Za našo zadnjo nalogo pri tej metriki smo oba klepetalna robota vprašali, koliko jabolk bo ostalo na jablani po pet oziroma 10 dni, če smo začeli z 10 jabolki in smo jih pet narezali, ko smo bili še na drevesu. ChatGPT je rekel, da bo ostalo še 10 jabolk.

Claude AI je na drugi strani podal bolj zdravorazumski odgovor s spoznanjem, da bo pet narezanih jabolk verjetno zgnilo.

Claude AI je očitno dobil to. Preizkusili smo še nekaj zapletenih težav in oba klepetalna robota sta imela kar nekaj uspehov in neuspehov pri spopadanju z njimi. Glede na rezultat, ki smo ga opazili, je morda pošteno reči, da čeprav ima ChatGPT prednost, si oba klepetalna robota nista preveč oddaljena glede zdrave pameti in sposobnosti logičnega sklepanja.

ChatGPT vs. Claude AI: Matematične spretnosti

Tudi če nikoli ne nameravate uporabiti ChatGPT ali Claude AI za reševanje domače naloge iz algebre, imajo njihove matematične sposobnosti daljnosežne posledice. Za klepetalne robote z umetno inteligenco je matematika ključ do razumevanja logike resničnega sveta, prepoznavanja napačnega razmišljanja in priznavanja napak.

V bistvu je znanje matematike temeljna metrika umetne inteligence. Torej, med ChatGPT in Claude AI, kateri chatbot je bolj vešč matematike? Oba klepetalnika smo zadolžili, da rešita zapleten problem produktivnosti matematike. Začeli smo s Claude AI in chatbot je rešil težavo.

ChatGPT je prav tako rešil težavo.

Če nadaljujemo, smo prosili oba chatbota za rešitev 8/a-1 = 20/3a-1, dokaj preprost matematični problem s presenetljivo visoko stopnjo napak med klepetalnimi roboti z umetno inteligenco. ChatGPT ga je lahko rešil in zagotovil pravilen odgovor -3 ob prvem poskusu.

Claude AI ni uspel v prvem poskusu, a ko smo ga pozvali, naj težavo reši korak za korakom (kar ga prisili, da razmisli o vsakem koraku svoje logike), ga je lahko razbil.

Poskusili smo še nekaj matematičnih nalog. Medtem ko sta oba chatbota v nekaterih primerih uspela v prvem poskusu, je Claude AI v več primerih potreboval drugi ali tretji poskus, da je zagotovil pravi odgovor. Kar zadeva matematične sposobnosti, bomo krono dali ChatGPT.

ChatGPT vs. Claude AI: Ustvarjalnost

Eden največjih navdušencev nad Claude AI so njegove ustvarjalne sposobnosti. Toda ali se lahko ujema z ustvarjalnostjo ChatGPT? Ali pa bi lahko presegel ChatGPT? Da bi preizkusili oba chatbota, smo ju zadolžili, da napišeta besedilo za rap pesem, ki se rima.

Izbrali smo rimani rap test, ker je to nekaj, s čimer se bori veliko jezikovnih modelov. Večina modelov običajno ne bo pravilno rimala ali bo pravilno rimala, medtem ko samo besedilo nima smisla. Da bo stvar bolj zanimiva, bo rap pesem govorila o gojenju kumar.

Tako smo ChatGPT in Clauda AI prosili, naj "napišeta rimani rap o gojenju kumar kot kmet in zaradi tega postal milijonar." ChatGPT je bil prvi in ​​kot je bilo pričakovano, je ustvaril nekaj razburljivih besedila.

Nato smo isti poziv posredovali Claudu AI, ki mu je tudi dal pošteno priložnost.

Obe besedili sta dobri, vendar se je zdelo, da ima ChatGPT prednost. Imel je boljše rime in dosegli smo rezultat, ki smo ga potrebovali na prvem poskusu. Morali smo poskusiti trikrat, preden je Claude AI uspel ustvariti besedila, ki so se rimala. Tega bomo dali ChatGPT.

Ko je preizkusil še nekaj ustvarjalnih nalog, se je zdelo, da je Claude AI blestel pri nalogah, povezanih s pisanjem, in je lahko napisal bolj naravno zvenečo vsebino, kot bi to storil človeški pisatelj. čeprav ChatGPT je bil boljši pri premagovanju kompleksnejših ustvarjalnih nalog, se včasih ni mogel otresti tistega občutka klepetalnega robota AI v besedilu, ki ga je ustvaril. Naša sodba? Tako ChatGPT kot Claude AI sta ustvarjalna sama po sebi.

ChatGPT vs. Claude AI: Spretnosti kodiranja

Tako kot matematične spretnosti so tudi spretnosti kodiranja še ena zelo pomembna metrika za presojo sposobnosti klepetalnega robota z umetno inteligenco. Medtem ko večina uporabnikov verjetno ne bo nikoli uporabite chatbot za kodiranje, obstajajo pomembne osnovne posledice za sposobnost klepetalnega robota, da spretno piše in razume kodo.

Čeprav so chatboti trenutno izpopolnjeni, še zdaleč niso to, kar bi dejansko lahko postali, če in ko bodo sposobni pisati kodo spretno. Da se lahko klepetalni roboti z umetno inteligenco resnično razvijejo v zmogljive pomočnike z umetno inteligenco, ki zmorejo več kot samo ustvarjanje besedila, morajo biti sposobni napisati kodo, ki rešuje težave na zahtevo. Prej smo razpravljali o tem, kako pomembne so veščine kodiranja za klepetalne robote z umetno inteligenco v našem Razlagalec tolmača kod ChatGPT.

Kljub temu smo oba chatbota postavili na dve nalogi kodiranja. ChatGPT in Clauda AI smo prosili, naj napišeta funkcionalno kodo za aplikacijo seznama opravil. Začenši s ChatGPT, je klepetalni robot z umetno inteligenco že v prvem poskusu lahko zagotovil funkcionalno aplikacijo za seznam opravil. Kopirali smo ga in ga zagnali v brskalniku in deloval je popolnoma brez napak. Tukaj je izpis v brskalniku.

Če se premaknemo na Claude AI, je chatbot napisal jasno razumljivo kodo. Struktura in logika sta se zdeli v redu. Na žalost je Claude AI kljub večkratnim poskusom pogrešal nekaj kritične logike, da bi se koda dejansko izvajala v brskalniku. Tole je neuspeh.

Potem ko je Claude AI padel na zadnjem preizkusu, smo poskusili z drugačno nalogo kodiranja, tisto, ki se je nanašala bolj na analizo kode in manj na pisanje nove kode. Naložili smo pet datotek PHP, ki predstavljajo celotno zaledje spletnega mesta, in vprašali Claude AI in ChatGPT kjer bi morali urediti vse naložene datoteke, da zagotovimo, da prejmemo pošto, ko se nov uporabnik registrira na mesto.

Presenetljivo je, da ChatGPT, kljub navidezno boljšim sposobnostim kodiranja, kljub večkratnim poskusom ni uspel. Po drugi strani pa je Claude AI uspel strokovno analizirati kodo, medtem ko je prepoznal prava mesta, ki jih je bilo treba urediti, da bi dosegli želene rezultate.

Seveda to ni bil osamljen primer, ponovili smo ga z več drugimi kodnimi datotekami, vendar se je ChatGPT pri večini primerov spotaknil in obstal, medtem ko je Claude AI še naprej zagotavljal impresivne rezultate. Kar zadeva veščine kodiranja, zmagovalec ni povsem preprost.

ChatGPT je očitno bistveno boljši pri pisanju nove kode in lahko upravlja kompleksno kodo z impresivno strokovnostjo. Vendar je Claude AI bistveno boljši pri analizi velikih baz kode. Torej, če želite napisati kodo za kakšno novo idejo, ki jo imate, je ChatGPT orodje, na katerega se lahko obrnete. Če želite analizirati ali razumeti osnovo kode s tisoči vrstic v več datotekah, potem zagotovo priporočamo Claude AI.

Claude AI je močan tekmec v bloku

Claude AI predstavlja močno konkurenco za ChatGPT – tisto, ki se lahko nekoč kosa s ChatGPT in ga potencialno preseže. Glede na to, da je Claude razmeroma nov model umetne inteligence, je zavidanja vredno, da se lahko spopade s ChatGPT tako kot trenutno. Pojav Claude AI in kakovost, ki jo ponuja, dokazujeta, da se konkurenca segreva.