OpenAI je ChatGPT omogočil, da govori s sintetiziranim glasom in kmalu bo na voljo na vašem pametnem telefonu.

ChatGPT naj bi postal interaktivna generativna izkušnja AI. OpenAI je razkril, da bo vodilni klepetalni robot z umetno inteligenco na svetu lahko govoril in odgovarjal na uporabniške poizvedbe s sintetiziranim, predvidoma ustvarjenim glasom.

Skupaj s svojim novoodkritim glasom se bo lahko ChatGPT tudi odzval in razpravljal o določenih slikah, ki so bile naložene vanj ali posnete med uporabo aplikacije ChatGPT za Android ali iOS. Funkcija prepoznavanja slik zveni podobno kot Google Lens in druge aplikacije, ki uporabljajo nevronska omrežja za natančno zaznavanje podatkov in informacij.

OpenAI daje ChatGPT glas

25. septembra 2023, razvijalec ChatGPT Razkrit OpenAI svojemu vodilnemu generativnemu klepetalnemu robotu z umetno inteligenco na svetu bi dal glas. Uporabniki ChatGPT se lahko pogovarjajo neposredno s chatbotom in zahtevajo, da odgovori, kar ChatGPT dejansko omogoči, da se prvič pogovarja neposredno z glasom.

instagram viewer

Primer posnetka OpenAI prikazuje žensko, ki ChatGPT prosi, naj ustvari edinstveno pravljico za lahko noč, na kar se ChatGPT ustrezno odzove s sintetiziranim ženskim glasom.

Po navedbah Žično, je bil nov model pretvorbe besedila v govor razvit v podjetju. Ustvari lahko "človeški" zvok iz besedila in nekaj sekund vzorca govora (z uporabo modela OpenAI Whisper) in govorite v različnih tonih in slogih. Najdete lahko vrsto glasovnih vzorcev OpenAIjev blog.

Nekatera podjetja že uporabljajo nov glasovni model OpenAI. Na primer, Spotify uporablja OpenAI-jev model pretvorbe besedila v govor za prevajanje podcastov v različne jezike, pri čemer združuje prevajalsko sposobnost ChatGPT z njegovo novo govorno sposobnostjo.

Nov model besedila v govor ChatGPT je na voljo samo naročnikom Plus in Enterprise, ki uporabljajo uradno Aplikacije za Android in iOS in naj bi se začela izvajati v naslednjih dveh tednih (od 25. 2023). Poleg tega je nova glasovna funkcija sprva omejena na angleščino, čeprav bi pričakovali, da se bo to hitro spremenilo.

ChatGPT lahko prepozna in analizira slike in fotografije

Drugi del posodobitve OpenAI ChatGPT je zmožnost analiziranja in pogovora o slikah, naloženih v orodje. Možnost vizualne analize slike je bila predstavljena v videoposnetkih posodobitve GPT-4, vendar se od takrat o njej ni veliko razpravljalo (Razen tolmača kode ChatGPT).

Zdaj ChatGPT pridobi podobno funkcionalnost kot Google Lens. Sliko lahko naložite v ChatGPT ali posnamete fotografijo s fotoaparatom pametnega telefona v aplikaciji ChatGPT, ki bo podrobno opisala sliko in po potrebi dodala več konteksta.

Če ga imenujemo "podobno kot Google Lens", je res krivica. Možnost klepetanja naprej in nazaj o sliki za pridobitev več informacij in konteksta je izjemno uporabna za širok nabor nastavitev. Vendar je pomembno opozoriti na drobni tisk, pri čemer OpenAI jasno pove, da je omejil ChatGPT-ovo "zmožnost analiziranja in dajanja neposrednih izjav o ljudeh" zaradi zasebnosti in točnosti. Kljub temu, ali bi lahko orodje »Kdo je to«, ki ga poganja OpenAI, v prihodnosti nastajalo? (Upajmo, da ne!)

Tako kot novi model besedila v govor bo OpenAI v naslednjih dveh tednih uvedel prepoznavanje slik, čeprav bo na voljo na vseh platformah, ne le v aplikaciji ChatGPT.

Zasebnost, varnost in druge težave

Posledice glasovnega ChatGPT so ostre. Seveda, razburljivo je. Vendar ima možnost ustvarjanja edinstveno sintetiziranega glasu z uporabo samo kratkega izrezka kot primera precejšnje težave z zasebnostjo in varnostjo. Možnost zlonamernih akterjev, da izkoristijo ta orodja, je ogromna in kot pri vsakem generativnem orodju AI, ko duh izstopi iz steklenice, se nikakor ne bo več vrnil vanjo. Nobena regulacija AI s strani vlad ali miselnih voditeljev ne more obrniti plime nazaj.

Zdi se, da celo opozorilo OpenAI na to temo zaobide očitno, čeprav omenja težave:

Vendar pa te zmogljivosti predstavljajo tudi nova tveganja, kot je možnost, da se zlonamerni akterji lažno predstavljajo kot javne osebnosti ali zagrešijo goljufijo. Zato uporabljamo to tehnologijo za omogočanje posebnega primera uporabe – glasovnega klepeta.

Glede na to, da je to vrh ledene gore, pričakujte upor proti novoodkritemu glasu ChatGPT, zlasti enkrat obstaja predvidljiv porast neprijetnih naslovov, ki trdijo, da se ChatGPT uporablja za goljufije in tako na.

OpenAI spreminja ChatGPT v aplikacijo za umetno inteligenco

Bolj ko OpenAI ChatGPT dodaja uporabniku prijazne funkcije, bolj postaja priljubljena generativna aplikacija AI. Kot prvi, ki je med začetnim generativnim razcvetom umetne inteligence dosegel široko slavo, ChatGPT še vedno vodi in je edina aplikacija, ki jo nekateri uporabljajo, kljub konkurenci, kot sta Google Bard (in potencialno Google Gemini) in Anthropic Claude.

Dokler lahko OpenAI še naprej dodaja funkcije, ki olajšajo uporabo ChatGPT, bo ljudi zasvojil in se vse bolj približeval svojemu cilju resnično multimodalnega orodja AI.