Modeli GPT OpenAI so revolucionirali obdelavo naravnega jezika (NLP), vendar razen če plačate premijo dostop do storitev OpenAI, ne boste mogli natančno nastaviti in integrirati njihovih modelov GPT v aplikacije. Poleg tega bo imel OpenAI dostop do vseh vaših pogovorov, kar je lahko varnostna težava, če uporabljate ChatGPT za podjetja in druga bolj občutljiva področja svojega življenja. Če niste navdušeni nad tem, boste morda želeli preizkusiti GPT4All.

Torej, kaj točno je GPT4All? Kako deluje in zakaj ga uporabljati namesto ChatGPT?

Kaj je GPT4All?

GPT4All je odprtokodni ekosistem, ki se uporablja za integracijo LLM-jev v aplikacije brez plačila naročnine na platformo ali strojno opremo. Ustvaril ga je Nomic AI, podjetje za informacijsko kartografijo, katerega namen je izboljšati dostop do virov umetne inteligence.

GPT4All je zasnovan za delovanje na sodobnih do razmeroma sodobnih osebnih računalnikih, ne da bi potrebovali internetno povezavo ali celo GPE! To je mogoče, saj je večina modelov, ki jih ponuja GPT4All, kvantizirana tako, da so majhni kot nekaj gigabajtov in za delovanje potrebujejo le 4–16 GB RAM-a.

instagram viewer

To omogoča manjšim podjetjem, organizacijam in neodvisnim raziskovalcem, da uporabljajo in integrirajo LLM za posebne aplikacije. Z GPT4All, ki ga je mogoče preprosto namestiti z namestitvenim programom z enim klikom, lahko ljudje zdaj uporabljajo GPT4All in veliko svojih LLM-jev za ustvarjanje vsebine, pisanje kode, razumevanje dokumentov in informacij zbiranje.

Zakaj uporabljati GPT4ALL namesto ChatGPT?

Avtorstvo slike: bruce mars/Unsplash

Obstaja več razlogov, zakaj bi morda želeli uporabiti GPT4All namesto ChatGPT.

  • Prenosljivost: Modeli, ki jih ponuja GPT4All, zahtevajo samo štiri do osem gigabajtov pomnilnika za shranjevanje, ne potrebujejo GPE za delovanje in jih je mogoče preprosto shraniti na bliskovni pogon USB z namestitvenim programom GPT4All z enim klikom. Zaradi tega so GPT4All in njegovi modeli resnično prenosljivi in ​​uporabni na skoraj vseh sodobnih računalnikih.
  • Zasebnost in varnost: Kot je bilo že pojasnjeno, razen če nimate dostopa do ChatGPT Plus, so vse vaše konverzije ChatGPT dostopne prek OpenAI. GPT4All je osredotočen na preglednost in zasebnost podatkov; vaši podatki bodo shranjeni samo v vaši lokalni strojni opremi, razen če jih namenoma delite z GPT4All, da pomagate pri rasti njihovih modelov.
  • Način brez povezave: GPT je lastniški model, ki zahteva dostop do API-ja in stalno internetno povezavo za poizvedovanje ali dostop do modela. Če izgubite internetno povezavo ali imate težave s strežnikom, ne boste imeli dostopa do ChatGPT. To ne velja za GPT4All. Ker so vsi podatki že shranjeni v paketu s štirimi do osmimi gigabajti in se sklepanje izvaja lokalno, za dostop do katerega koli modela v GPT4All ne potrebujete internetne povezave. Še naprej lahko klepetate in natančno nastavljate svoj model tudi brez internetne povezave.
  • Brezplačno in odprtokodno: Več LLM-jev, ki jih ponuja GPT4All, je licenciranih pod GPL-2. To vsakomur omogoča natančno nastavitev in integracijo lastnih modelov za komercialno uporabo, ne da bi mu bilo treba plačati licenco.

Kako deluje GPT4All

Kot smo že omenili, je GPT4All ekosistem, ki se uporablja za lokalno usposabljanje in uvajanje LLM-jev v vašem računalniku, kar je neverjeten podvig! Običajno bi nalaganje standardnega 25-30 GB LLM-ja zahtevalo 32 GB RAM-a in grafični procesor poslovnega razreda.

Za primerjavo, LLM-ji, ki jih lahko uporabljate z GPT4All, potrebujejo samo 3 GB–8 GB prostora za shranjevanje in lahko delujejo na 4 GB–16 GB RAM-a. To omogoča izvajanje celotnega LLM na robni napravi, ne da bi potrebovali GPU ali zunanjo pomoč v oblaku.

Zahteve glede strojne opreme za izvajanje LLM-jev na GPT4All so bile znatno zmanjšane zaradi kvantizacije nevronske mreže. Z zmanjšanjem teže natančnosti in aktivacij v nevronski mreži je veliko modelov, ki jih ponuja GPT4All, mogoče izvajati na večini sorazmerno sodobnih računalnikov.

Podatki o usposabljanju, uporabljeni v nekaterih razpoložljivih modelih, so bili zbrani prek "kupa", ki je le postrgan podatek iz javno objavljene vsebine na internetu. Podatki se nato pošljejo v zbirko podatkov Atlas AI podjetja Nomic AI, ki jo je mogoče videti na podlagi korelacije na lahko vidnem 2D vektorskem zemljevidu (znanem tudi kot vektorsko bazo podatkov AI).

Z usposabljanjem Nomic AI za model Groovy in uporabo javno dostopnih podatkov je Nomic AI lahko izdal model z odprto licenco GPL, ki omogoča vsakomur, da ga uporablja, tudi za komercialne aplikacije.

Kako namestiti GPT4All

Namestitev GPT4All je preprosta in zdaj, ko je bila izdana GPT4All različica 2, je še lažja! Najboljši način za namestitev GPT4All 2 je prenos namestitvenega programa z enim klikom:

Prenesi:GPT4All za Windows, macOS ali Linux (brezplačno)

Naslednja navodila so za Windows, vendar lahko GPT4All namestite v vsak večji operacijski sistem.

Po prenosu dvokliknite namestitveni program in izberite Namestite. Windows Defender lahko namestitev vidi kot zlonamerno, ker lahko postopek Microsoftovega dajanja veljavnih podpisov za aplikacije tretjih oseb traja dolgo. Vendar naj bi bilo to kmalu popravljeno. Od pisanja bi morali biti varni, če ste aplikacijo GPT4All prenesli z uradne spletne strani. Kliknite na Vseeno namestite za namestitev GPT4All.

Ko odprete aplikacijo, boste morali izbrati model, ki ga želite uporabiti. GPT4ALL vam ponuja več modelov, od katerih bodo vsi imeli svoje prednosti in slabosti. Če želite vedeti, kateri model prenesti, je tukaj tabela, ki prikazuje njihove prednosti in slabosti.

Model

Velikost

Opomba

Parametri

Vrsta

Kvantizacija

Hermes

7,58 GB

  • Na podlagi navodil
  • Daje dolge odgovore
  • Kurirano s 300.000 necenzuriranimi navodili
  • Ni ga mogoče uporabljati v komercialne namene

13 milijard

LLaMA

q4_0

GPT4All Falcon

3,78 GB

  • Hitri odzivi
  • Na podlagi navodil
  • Licenca za komercialno uporabo

7 milijard

Sokol

q4_0

Groovy

8 GB

  • Hitri odzivi
  • - Ustvarjalni odgovori
  • Na podlagi navodil
  • Licenca za komercialno uporabo

7 milijard

GPT-J

q4_0

ChatGPT-3.5 Turbo

Minimalno

  • Zahteva osebni API
  • Vaše klepete bo poslal v OpenAI
  • GPT4All se uporablja samo za komunikacijo z OpenAI

?

GPT

NA

Klepet GPT-4

Minimalno

  • Zahteva osebni API
  • Vaše klepete bo poslal v OpenAI
  • GPT4All se uporablja samo za komunikacijo z OpenAI

?

GPT

NA

Snoozy

7,58 GB

  • Na podlagi navodil
  • Počasnejši od Groovyja, vendar z bolj kakovostnimi odzivi
  • Ni ga mogoče uporabljati v komercialne namene

13 milijard

LLaMA

q4_0

MPT klepet

4,52 GB

  • Hitri odzivi
  • Na podlagi klepeta
  • Ni ga mogoče uporabljati v komercialne namene

7 milijard

MPT

q4_0

Orka

3,53 GB

  • Na podlagi navodil
  • Razlaga nastavljene nize podatkov
  • Pristopi k izdelavi nabora podatkov Orca Research Paper
  • Licenca za komercialno uporabo

7 milijard

OpenLLaMA

q4_0

Vikunja

3,92 GB

  • Na podlagi navodil
  • Ni ga mogoče uporabljati v komercialne namene

7 milijard

LLaMA

q4_2

Čarovnik

3,92 GB

  • Na podlagi navodil
  • Ni ga mogoče uporabljati v komercialne namene

7 milijard

LLaMA

q4_2

Čarovnik brez cenzure

7,58 GB

  • Na podlagi navodil
  • Ni ga mogoče uporabljati v komercialne namene

13 milijard

LLaMA

q4_0

Upoštevajte, da imajo ponujeni modeli različne ravni omejitev. Vseh modelov ni mogoče komercialno uporabljati brezplačno; nekateri bodo potrebovali več virov strojne opreme, drugi pa ključ API. Najmanj restriktivni modeli, ki so na voljo v GPT4All, so Groovy, GPT4All Falcon in Orca.

Ali lahko trenirate GPT4All modele?

Da, vendar ne kvantizirane različice. Če želite učinkovito natančno prilagoditi modele GPT4All, morate prenesti neobdelane modele in uporabiti grafične procesorje za podjetja, kot je npr. AMD-jevi Instinct Acceleratorji ali grafični procesorji NVIDIA Ampere ali Hopper. Poleg tega boste morali usposobiti model prek okvira za usposabljanje AI, kot je LangChain, kar bo zahtevalo nekaj tehničnega znanja.

Natančna nastavitev modela GPT4All bo zahtevala nekaj denarnih sredstev in tudi nekaj tehničnega znanja, a če želite modelu GPT4All posredovati samo podatke po meri, lahko še naprej usposabljajte model z generiranjem razširjenega iskanja (ki jezikovnemu modelu pomaga pri dostopu in razumevanju informacij zunaj njegovega osnovnega usposabljanja za dokončanje naloge). To lahko storite tako, da GPT4All pozovete k modeliranju vaših podatkov po meri, preden zastavite vprašanje. Podatke po meri je treba shraniti lokalno in ob pozivu vam mora model zagotoviti podatke, ki ste jih dali nekoč.

Bi morali uporabljati GTP4All?

Zamisel za GPT4All je zagotoviti brezplačno in odprtokodno platformo, kjer lahko ljudje izvajajo velike jezikovne modele na svojih računalnikih. Trenutno so GPT4All in njegovi kvantizirani modeli odlični za eksperimentiranje, učenje in preizkušanje različnih LLM v varnem okolju. Za profesionalne delovne obremenitve še vedno priporočamo uporabo ChatGPT, saj je model bistveno bolj zmogljiv.

Na splošno ni razloga, da bi se omejili na enega. Ker se njun primer uporabe ne prekriva, poskusite uporabiti oba.