I modelli GPT di OpenAI hanno rivoluzionato l'elaborazione del linguaggio naturale (NLP), ma a meno che tu non paghi premium accesso ai servizi di OpenAI, non sarai in grado di mettere a punto e integrare i loro modelli GPT nel tuo applicazioni. Inoltre, OpenAI avrà accesso a tutte le tue conversazioni, il che potrebbe rappresentare un problema di sicurezza se utilizzi ChatGPT per lavoro e altre aree più sensibili della tua vita. Se non ti piace questo, potresti provare GPT4All.

Quindi cos'è esattamente GPT4All? Come funziona e perché usarlo su ChatGPT?

Cos'è GPT4All?

GPT4All è un ecosistema open source utilizzato per integrare LLM nelle applicazioni senza pagare una piattaforma o un abbonamento hardware. È stato creato da Nomic AI, una società di cartografia informativa che mira a migliorare l'accesso alle risorse AI.

GPT4All è progettato per funzionare su PC moderni o relativamente moderni senza bisogno di una connessione Internet o persino di una GPU! Ciò è possibile poiché la maggior parte dei modelli forniti da GPT4All sono stati quantizzati per essere piccoli come pochi gigabyte, richiedendo solo 4-16 GB di RAM per funzionare.

instagram viewer

Ciò consente alle piccole imprese, alle organizzazioni e ai ricercatori indipendenti di utilizzare e integrare un LLM per applicazioni specifiche. E con GPT4All facilmente installabile tramite un programma di installazione con un clic, ora le persone possono utilizzare GPT4All e molti dei suoi LLM per la creazione di contenuti, la scrittura di codice, la comprensione di documenti e informazioni assembramento.

Perché utilizzare GPT4ALL su ChatGPT?

Credito immagine: bruce mars/Unsplash

Esistono diversi motivi per cui potresti voler utilizzare GPT4All over ChatGPT.

  • Portabilità: I modelli forniti da GPT4All richiedono solo da quattro a otto gigabyte di memoria, non richiedono una GPU per funzionare e possono essere facilmente salvati su un'unità flash USB con il programma di installazione con un clic di GPT4All. Ciò rende GPT4All e i suoi modelli veramente portatili e utilizzabili praticamente su qualsiasi computer moderno.
  • Privacy e sicurezza: Come spiegato in precedenza, a meno che tu non abbia accesso a ChatGPT Plus, tutte le tue conversioni ChatGPT sono accessibili da OpenAI. GPT4All si concentra sulla trasparenza e sulla privacy dei dati; i tuoi dati verranno salvati solo sul tuo hardware locale a meno che tu non li condivida intenzionalmente con GPT4All per aiutare a far crescere i loro modelli.
  • Modalità offline: GPT è un modello proprietario che richiede l'accesso API e una connessione Internet costante per interrogare o accedere al modello. Se perdi una connessione Internet o hai un problema con il server, non avrai accesso a ChatGPT. Questo non è il caso di GPT4All. Poiché tutti i dati sono già archiviati in un pacchetto da quattro a otto gigabyte e l'inferenza viene eseguita localmente, non è necessaria una connessione Internet per accedere a nessun modello in GPT4All. Puoi continuare a chattare e perfezionare il tuo modello anche senza una connessione Internet.
  • Gratuito e open source: Diversi LLM forniti da GPT4All sono concessi in licenza con GPL-2. Ciò consente a chiunque di perfezionare e integrare i propri modelli per uso commerciale senza dover pagare per la licenza.

Come funziona GPT4All

Come discusso in precedenza, GPT4All è un ecosistema utilizzato per addestrare e distribuire LLM localmente sul tuo computer, il che è un'impresa incredibile! In genere, il caricamento di un LLM standard da 25-30 GB richiederebbe 32 GB di RAM e una GPU di livello aziendale.

Per fare un confronto, gli LLM che puoi utilizzare con GPT4All richiedono solo 3 GB-8 GB di spazio di archiviazione e possono funzionare con 4 GB-16 GB di RAM. Ciò rende possibile l'esecuzione di un intero LLM su un dispositivo edge senza bisogno di una GPU o di assistenza cloud esterna.

I requisiti hardware per eseguire LLM su GPT4All sono stati notevolmente ridotti grazie alla quantizzazione della rete neurale. Riducendo il peso della precisione e le attivazioni in una rete neurale, molti dei modelli forniti da GPT4All possono essere eseguiti sulla maggior parte dei computer relativamente moderni.

I dati di addestramento utilizzati in alcuni dei modelli disponibili sono stati raccolti attraverso "la pila", che è solo dati estratti da contenuti rilasciati pubblicamente su Internet. I dati vengono quindi inviati al database Atlas AI di Nomic AI, che può essere visualizzato in base alle correlazioni su una mappa vettoriale 2D di facile visualizzazione (nota anche come un database vettoriale AI).

Grazie all'addestramento di Nomic AI del modello Groovy e all'utilizzo di dati pubblicamente disponibili, Nomic AI è stata in grado di rilasciare il modello con una licenza GPL aperta che consente a chiunque di utilizzarlo, anche per applicazioni commerciali.

Come installare GPT4All

Installare GPT4All è semplice e ora che è stata rilasciata la versione 2 di GPT4All, è ancora più semplice! Il modo migliore per installare GPT4All 2 è scaricare il programma di installazione con un clic:

Scaricamento:GPT4Tutti per Windows, macOS o Linux (gratuito)

Le seguenti istruzioni sono per Windows, ma puoi installare GPT4All su tutti i principali sistemi operativi.

Una volta scaricato, fai doppio clic sul programma di installazione e seleziona Installare. Windows Defender potrebbe vedere l'installazione come dannosa perché il processo per Microsoft di fornire firme valide per applicazioni di terze parti può richiedere molto tempo. Tuttavia, questo dovrebbe essere risolto presto. Al momento della scrittura, fintanto che hai scaricato l'applicazione GPT4All dal sito Web ufficiale, dovresti essere al sicuro. Clicca su Installa comunque per installare GPT4All.

Una volta aperta l'applicazione, dovrai selezionare un modello da utilizzare. GPT4ALL ti offre diversi modelli, ognuno dei quali avrà i suoi punti di forza e di debolezza. Per sapere quale modello scaricare, ecco una tabella che ne mostra pregi e difetti.

Modello

Misurare

Nota

Parametri

Tipo

Quantizzazione

Ermete

7,58GB

  • Basato su istruzioni
  • Fornisce risposte lunghe
  • Curato con 300.000 istruzioni non censurate
  • Non può essere utilizzato commercialmente

13 miliardi

Lama

q4_0

GPT4All Falcon

3,78GB

  • Risposte rapide
  • Basato sulle istruzioni
  • Licenza per uso commerciale

7 miliardi

Falco

q4_0

Fantastico

8GB

  • Risposte rapide
  • -Risposte creative
  • Basato sulle istruzioni
  • Licenza per uso commerciale

7 miliardi

GPT-J

q4_0

ChatGPT-3.5 Turbo

Minimo

  • Richiede un'API personale
  • Invierà le tue chat a OpenAI
  • GPT4All viene utilizzato solo per comunicare con OpenAI

?

GPT

N / A

ChatGPT-4

Minimo

  • Richiede un'API personale
  • Invierà le tue chat a OpenAI
  • GPT4All viene utilizzato solo per comunicare con OpenAI

?

GPT

N / A

Snoozy

7,58GB

  • Basato sulle istruzioni
  • Più lento di Groovy ma con risposte di qualità superiore
  • Non può essere utilizzato commercialmente

13 miliardi

Lama

q4_0

Chat MPT

4,52GB

  • Risposte rapide
  • Basato sulla chat
  • Non può essere utilizzato commercialmente

7 miliardi

MPT

q4_0

Orca

3,53GB

  • Basato sulle istruzioni
  • Spiega i set di dati ottimizzati
  • Approcci alla costruzione di set di dati di Orca Research Paper
  • Licenza per uso commerciale

7 miliardi

OpenLLaMA

q4_0

Vigogna

3,92GB

  • Basato sulle istruzioni
  • Non può essere utilizzato commercialmente

7 miliardi

Lama

q4_2

Procedura guidata

3,92GB

  • Basato sulle istruzioni
  • Non può essere utilizzato commercialmente

7 miliardi

Lama

q4_2

Mago senza censura

7,58GB

  • Basato sulle istruzioni
  • Non può essere utilizzato commercialmente

13 miliardi

Lama

q4_0

Tieni presente che i modelli forniti hanno diversi livelli di restrizioni. Non tutti i modelli possono essere utilizzati commercialmente gratuitamente; alcuni avranno bisogno di più risorse hardware, mentre altri avranno bisogno di una chiave API. I modelli meno restrittivi disponibili in GPT4All sono Groovy, GPT4All Falcon e Orca.

Puoi addestrare i modelli GPT4All?

Sì, ma non le versioni quantizzate. Per ottimizzare efficacemente i modelli GPT4All, è necessario scaricare i modelli non elaborati e utilizzare GPU di livello aziendale come Gli acceleratori Instinct di AMD o le GPU Ampere o Hopper di NVIDIA. Inoltre, dovrai addestrare il modello attraverso un framework di addestramento AI come LangChain, che richiederà alcune conoscenze tecniche.

La messa a punto di un modello GPT4All richiederà alcune risorse monetarie e un po' di know-how tecnico, ma se desideri fornire solo dati personalizzati a un modello GPT4All, puoi farlo continuare ad addestrare il modello attraverso il recupero della generazione aumentata (che aiuta un modello linguistico ad accedere e comprendere le informazioni al di fuori della sua formazione di base per completare compiti). Puoi farlo chiedendo a GPT4All di modellare i tuoi dati personalizzati prima di porre una domanda. I dati personalizzati dovrebbero essere salvati localmente e, quando richiesto, il modello dovrebbe essere in grado di fornirti le informazioni che hai fornito una volta.

Dovresti usare GTP4All?

L'idea di GPT4All è quella di fornire una piattaforma gratuita e open source in cui le persone possono eseguire modelli linguistici di grandi dimensioni sui propri computer. Attualmente, GPT4All e i suoi modelli quantizzati sono ottimi per sperimentare, apprendere e provare diversi LLM in un ambiente sicuro. Per i carichi di lavoro professionali, consigliamo comunque di utilizzare ChatGPT poiché il modello è significativamente più capace.

Nel complesso, non c'è motivo per cui dovresti limitarti a uno. Poiché il loro caso d'uso non si sovrappone, dovresti provare a utilizzarli entrambi.