Želite ChatGPT zagotoviti svoje podatke po meri? Tukaj je korak za korakom, kako to narediti!
Z zagotavljanjem tehnologije GPT v zmogljivem in za uporabo preprostem klepetalnem robotu je ChatGPT postal najbolj priljubljeno orodje AI na svetu. Veliko ljudi uporablja ChatGPT za zagotavljanje privlačnih pogovorov, odgovarjanje na vprašanja, ponujanje kreativnih predlogov ter pomoč pri kodiranju in pisanju. Vendar je ChatGPT omejen, saj ne morete shranjevati svojih podatkov za dolgoročno osebno uporabo, in njegova presečna točka znanja septembra 2021.
Kot rešitev lahko uporabimo API OpenAI in LangChain, da ChatGPT zagotovimo podatke po meri in posodobljene informacije po letu 2021, da ustvarimo primerek ChatGPT po meri.
Zakaj ChatGPT zagotoviti podatke po meri?
Hranjenje ChatGPT s podatki po meri in zagotavljanje posodobljenih informacij po njegovem presečnem datumu znanja zagotavlja številne prednosti v primerjavi z običajno uporabo ChatGPT. Tukaj je nekaj izmed njih:
- Prilagojene interakcije: Z zagotavljanjem podatkov po meri ChatGPT lahko uporabniki ustvarijo bolj prilagojeno izkušnjo. Model je mogoče učiti na posebnih naborih podatkov, ki so pomembni za posamezne uporabnike ali organizacije, kar ima za posledico odzive, prilagojene njihovim edinstvenim potrebam in željam.
- Strokovno znanje za določeno področje: Integracija podatkov po meri omogoča ChatGPT, da se specializira za določene domene ali panoge. Lahko se uri na znanju, terminologiji in trendih, specifičnih za panogo, kar omogoča natančnejše in pronicljive odzive na teh specifičnih področjih.
- Aktualne in točne informacije: Dostop do posodobljenih informacij zagotavlja, da ChatGPT ostane na tekočem z najnovejšimi dogodki in znanjem. Zagotovi lahko natančne odgovore na podlagi nedavnih dogodkov, novic ali raziskav, zaradi česar je bolj zanesljiv vir informacij.
Zdaj, ko razumete pomen zagotavljanja podatkov po meri za ChatGPT, je tukaj korak za korakom, kako to storiti v vašem lokalnem računalniku.
1. korak: Namestite in prenesite programsko opremo in vnaprej pripravljen skript
Upoštevajte, da so ta navodila za računalnik z operacijskim sistemom Windows 10 ali Windows 11.
Če želite ChatGPT zagotoviti podatke po meri, boste morali namestiti in prenesti najnovejše Python3, Git, Microsoft C++ in skript za pridobivanje ChatGPT z GitHuba. Če imate v računalniku že nameščeno nekaj programske opreme, se prepričajte, da je posodobljena z najnovejšo različico, da se izognete kolcanju med postopkom.
Začnite z namestitvijo:
- Prenesi:Python3 (Prost)
- Prenesi:Git (Prost)
- Prenesi:Microsoft Visual Build Tools (Prost)
Opombe o namestitvi Python3 in Microsoft C++
Ko nameščate Python3, se prepričajte, da ste označili Dodajte python.exe v PATH pred klikom Namestiti zdaj. To je pomembno, saj vam omogoča dostop do Pythona v katerem koli imeniku v vašem računalniku.
Ko nameščate Microsoft C++, boste želeli namestiti Orodja za gradnjo Microsoft Visual Studio prvi. Ko je nameščen, lahko označite Razvoj namizja s C++ možnost in kliknite Namestite z vsemi neobveznimi orodji, ki so samodejno označena na desni stranski vrstici.
Zdaj, ko ste namestili najnovejše različice Python3, Git in Microsoft C++, lahko prenesete skript Python za preprosto poizvedovanje po lokalnih podatkih po meri.
Prenesi: Skript za iskanje ChatGPT (Prost)
Za prenos skripte kliknite na Koda, nato izberite Prenesite ZIP. To bi moralo prenesti skript Python v vaš privzeti ali izbrani imenik.
Po prenosu lahko zdaj nastavimo lokalno okolje.
2. korak: Nastavite lokalno okolje
Če želite nastaviti okolje, boste morali odpreti terminal v glavni mapi chatgpt-retrieval-main, ki ste jo prenesli. Če želite to narediti, odprite chatgpt-retrieval-main mapo, z desno miškino tipko kliknite in izberite Odprite v terminalu.
Ko je terminal odprt, kopirajte in prilepite ta ukaz:
pip namestite langchain openai chromadb tiktoken nestrukturiran
Ta ukaz uporablja Pythonov upravitelj paketov za ustvarjanje in upravljanje virtualnega okolja Python potrebno.
Po ustvarjanju virtualnega okolja moramo zagotoviti ključ OpenAI API za dostop do njihovih storitev. Najprej bomo morali ustvariti ključ API iz Spletno mesto s ključi API OpenAI s klikom na Ustvari nov skrivni ključ, dodajanje imena za ključ in nato pritisnite Gumb Ustvari skrivni ključ.
Dobili boste niz znakov. To je vaš ključ OpenAI API. Kopirajte ga s klikom na ikono za kopiranje ob strani ključa API. Upoštevajte, da mora biti ta ključ API tajen. Ne delite ga z drugimi, razen če res nameravate, da ga uporabljajo z vami.
Po kopiranju se vrnite v glavno mapo chatgpt-retrieval-main in odprite konstante z Beležnica. Zdaj zamenjajte ogrado s svojim ključem API. Ne pozabite shraniti datoteke!
Zdaj, ko ste uspešno nastavili svoje virtualno okolje in dodali ključ OpenAI API kot spremenljivko okolja. Zdaj lahko ChatGPT posredujete svoje podatke po meri.
3. korak: Dodajanje podatkov po meri
Če želite dodati podatke po meri, postavite vse besedilne podatke po meri v podatke mapo znotraj chatgpt-retrieval-main. Format besedilnih podatkov je lahko v obliki PDF, TXT ali DOC.
Kot lahko vidite na zgornjem posnetku zaslona, sem dodal besedilno datoteko, ki vsebuje sestavljen osebni urnik, članek, o katerem sem napisal AMD-jevi Instinct Acceleratorjiin dokument PDF.
4. korak: Poizvedovanje ChatGPT prek terminala
Skript Python nam omogoča poizvedovanje po podatkih iz podatkov po meri, ki smo jih dodali v podatkovno mapo in internet. Z drugimi besedami, imeli boste dostop do običajnega zaledja ChatGPT in vseh podatkov, ki so lokalno shranjeni v podatkovni mapi.
Če želite uporabiti skript, zaženite python chatgpt.py skript in nato kot argument dodajte svoje vprašanje ali poizvedbo.
python chatgpt.py "TVOJE VPRAŠANJE"
Vprašanja postavite v narekovaje.
Da preverim, ali smo ChatGPT uspešno posredovali svoje podatke, bom zastavil osebno vprašanje glede Personal Sched.txt mapa.
Delovalo je! To pomeni, da je ChatGPT lahko prebral prej naveden Personal Sched.txt. Zdaj pa poglejmo, ali smo ChatGPT uspešno napolnili z informacijami, ki jih ne pozna zaradi njegovega presečnega datuma znanja.
Kot lahko vidite, je pravilno opisal AMD Instinct MI250x, ki je bil izdan po datumu preseka znanja ChatGPT -3.
Omejitve Custom ChatGPT
Čeprav podajanje GPT-3.5 s podatki po meri odpira več načinov za uporabo in uporabo LLM, obstaja nekaj pomanjkljivosti in omejitev.
Najprej morate sami zagotoviti vse podatke. Še vedno lahko dostopate do vsega znanja GPT-3.5 do njegovega presečnega datuma znanja; vendar morate navesti vse dodatne podatke. To pomeni, da če želite, da vaš lokalni model pozna določeno temo na internetu, ki je GPT-3.5 še ne pozna, morali boste iti na internet in sami postrgati podatke ter jih shraniti kot besedilo v podatkovno mapo chatgpt-retrieval-main.
Druga težava je, da takšno poizvedovanje po ChatGPT zahteva več časa za nalaganje v primerjavi z neposrednim poizvedovanjem po ChatGPT.
Nazadnje, edini model, ki je trenutno na voljo, je GPT-3.5 Turbo. Tudi če imate dostop do GPT-4, ga ne boste mogli uporabiti za napajanje svojega primerka ChatGPT po meri.
ChatGPT po meri je super, a omejen
Zagotavljanje podatkov po meri v ChatGPT je zmogljiv način, da iz modela izkoristite več. S to metodo lahko model napolnite s poljubnimi besedilnimi podatki in ga pozovete tako kot običajni ChatGPT, čeprav z nekaterimi omejitvami. Vendar se bo to v prihodnosti spremenilo, saj bo lažje integrirati naše podatke z LLM, skupaj z dostopom do najnovejšega modela GPT-4.