Stai cercando di fornire a ChatGPT i tuoi dati personalizzati? Ecco un passo dopo passo su come fare proprio questo!

Fornendo la tecnologia GPT in un chatbot potente e facile da usare, ChatGPT è diventato lo strumento AI più popolare al mondo. Molte persone usano ChatGPT per fornire conversazioni coinvolgenti, rispondere a domande, offrire suggerimenti creativi e aiutare nella codifica e nella scrittura. Tuttavia, ChatGPT è limitato in quanto non è possibile archiviare i dati per uso personale a lungo termine e il punto limite dei dati di conoscenza di settembre 2021.

Come soluzione alternativa, possiamo utilizzare l'API di OpenAI e LangChain per fornire a ChatGPT dati personalizzati e informazioni aggiornate oltre il 2021 per creare un'istanza ChatGPT personalizzata.

Perché fornire a ChatGPT dati personalizzati?

Fornire a ChatGPT dati personalizzati e fornire informazioni aggiornate oltre la data limite di conoscenza offre numerosi vantaggi rispetto al semplice utilizzo di ChatGPT come al solito. Eccone alcuni:

instagram viewer
  • Interazioni personalizzate: Fornendo a ChatGPT dati personalizzati, gli utenti possono creare un'esperienza più personalizzata. Il modello può essere addestrato su set di dati specifici rilevanti per singoli utenti o organizzazioni, ottenendo risposte su misura per le loro esigenze e preferenze uniche.
  • Competenza specifica del dominio: L'integrazione dei dati personalizzati consente a ChatGPT di specializzarsi in particolari domini o settori. Può essere addestrato su conoscenze, terminologia e tendenze specifiche del settore, consentendo risposte più accurate e approfondite all'interno di quelle aree specifiche.
  • Informazioni aggiornate e accurate: L'accesso a informazioni aggiornate garantisce che ChatGPT rimanga aggiornato con gli ultimi sviluppi e conoscenze. Può fornire risposte accurate basate su eventi recenti, notizie o ricerche, rendendolo una fonte di informazioni più affidabile.

Ora che comprendi l'importanza di fornire dati personalizzati a ChatGPT, ecco una guida dettagliata su come farlo sul tuo computer locale.

Passaggio 1: installa e scarica il software e lo script predefinito

Si prega di notare che le seguenti istruzioni sono per un computer Windows 10 o Windows 11.

Per fornire dati personalizzati a ChatGPT, devi installare e scaricare l'ultima versione di Python3, Git, Microsoft C++ e lo script di recupero di ChatGPT da GitHub. Se hai già alcuni dei software installati sul tuo PC, assicurati che siano aggiornati con l'ultima versione per evitare intoppi durante il processo.

Inizia installando:

  • Scaricamento:Python3 (Gratuito)
  • Scaricamento:Idiota (Gratuito)
  • Scaricamento:Strumenti di compilazione visiva di Microsoft (Gratuito)

Note sull'installazione di Python3 e Microsoft C++

Quando installi Python3, assicurati di spuntare il file Aggiungi python.exe a PATH opzione prima di fare clic Installa ora. Questo è importante in quanto ti consente di accedere a Python in qualsiasi directory sul tuo computer.

Quando installi Microsoft C++, ti consigliamo di installare Strumenti di compilazione di Microsoft Visual Studio Primo. Una volta installato, puoi spuntare il file Sviluppo desktop con C++ opzione e fare clic Installare con tutti gli strumenti opzionali spuntati automaticamente sulla barra laterale destra.

Ora che hai installato le versioni più recenti di Python3, Git e Microsoft C++, puoi scaricare lo script Python per interrogare facilmente i dati locali personalizzati.

Scaricamento: Script di recupero ChatGPT (Gratuito)

Per scaricare lo script, fare clic su Codice, quindi selezionare Scarica CAP. Questo dovrebbe scaricare lo script Python nella directory predefinita o selezionata.

Una volta scaricato, ora possiamo impostare un ambiente locale.

Passaggio 2: configurare l'ambiente locale

Per configurare l'ambiente, dovrai aprire un terminale nella cartella chatgpt-retrieval-main che hai scaricato. Per farlo, apri chatgpt-recupero-principale cartella, fare clic con il pulsante destro del mouse e selezionare Apri nel terminale.

Una volta aperto il terminale, copia e incolla questo comando:

pip install langchain openai chromadb tiktoken non strutturato

Questo comando utilizza il gestore pacchetti di Python per creare e gestire l'ambiente virtuale Python necessario.

Dopo aver creato l'ambiente virtuale, dobbiamo fornire una chiave API OpenAI per accedere ai loro servizi. Per prima cosa dobbiamo generare una chiave API dal file Sito delle chiavi API OpenAI cliccando su Crea una nuova chiave segreta, aggiungendo un nome per la chiave, quindi premendo il Crea pulsante chiave segreta.

Ti verrà fornita una stringa di caratteri. Questa è la tua chiave API OpenAI. Copialo facendo clic sull'icona di copia sul lato della chiave API. Tieni presente che questa chiave API deve essere tenuta segreta. Non condividerlo con altri a meno che tu non intenda davvero che lo usino con te.

Una volta copiato, torna alla cartella chatgpt-retrieval-main e apri le costanti con Bloc notes. Ora sostituisci il segnaposto con la tua chiave API. Ricordati di salvare il file!

Ora che hai configurato correttamente il tuo ambiente virtuale e hai aggiunto la tua chiave API OpenAI come variabile di ambiente. Ora puoi fornire i tuoi dati personalizzati a ChatGPT.

Passaggio 3: aggiunta di dati personalizzati

Per aggiungere dati personalizzati, inserisci tutti i tuoi dati di testo personalizzati nel file dati cartella all'interno di chatgpt-retrieval-main. Il formato dei dati di testo può essere in formato PDF, TXT o DOC.

Come puoi vedere dallo screenshot qui sopra, ho aggiunto un file di testo contenente un programma personale inventato, un articolo che ho scritto su Gli acceleratori Instinct di AMDe un documento PDF.

Passaggio 4: interrogazione di ChatGPT tramite terminale

Lo script Python ci consente di interrogare i dati dai dati personalizzati che abbiamo aggiunto alla cartella dei dati e a Internet. In altre parole, avrai accesso al solito backend ChatGPT e a tutti i dati archiviati localmente nella cartella dei dati.

Per utilizzare lo script, eseguire il file python chatgpt.py script e quindi aggiungi la tua domanda o query come argomento.

pitone chatgpt.py "LA TUA DOMANDA"

Assicurati di mettere le tue domande tra virgolette.

Per verificare se abbiamo fornito con successo i nostri dati a ChatGPT, farò una domanda personale riguardante il Sched.txt personale file.

Ha funzionato! Ciò significa che ChatGPT è stato in grado di leggere il file Personal Sched.txt fornito in precedenza. Ora vediamo se abbiamo alimentato con successo ChatGPT con informazioni che non conosce a causa della sua data limite di conoscenza.

Come puoi vedere, ha descritto correttamente l'AMD Instinct MI250x, che è stato rilasciato dopo la data limite di conoscenza di ChatGPT -3.

Limitazioni del ChatGPT personalizzato

Sebbene l'alimentazione di GPT-3.5 con dati personalizzati apra più modi per applicare e utilizzare l'LLM, ci sono alcuni inconvenienti e limitazioni.

Innanzitutto, devi fornire tu stesso tutti i dati. Puoi ancora accedere a tutta la conoscenza di GPT-3.5 fino alla data di interruzione della conoscenza; tuttavia, è necessario fornire tutti i dati aggiuntivi. Ciò significa che se desideri che il tuo modello locale sia a conoscenza di un determinato argomento su Internet che GPT-3.5 non conosce già, dovrai andare su Internet e raccogliere tu stesso i dati e salvarli come testo nella cartella dei dati di chatgpt-retrieval-main.

Un altro problema è che l'interrogazione di ChatGPT in questo modo richiede più tempo per il caricamento rispetto alla richiesta diretta di ChatGPT.

Infine, l'unico modello attualmente disponibile è il GPT-3.5 Turbo. Quindi, anche se hai accesso a GPT-4, non sarai in grado di utilizzarlo per alimentare la tua istanza ChatGPT personalizzata.

Chat GPT personalizzato è fantastico ma limitato

Fornire dati personalizzati a ChatGPT è un modo potente per ottenere di più dal modello. Attraverso questo metodo, puoi alimentare il modello con qualsiasi dato di testo che desideri e richiederlo proprio come un normale ChatGPT, anche se con alcune limitazioni. Tuttavia, questo cambierà in futuro poiché diventerà più facile integrare i nostri dati con LLM, insieme all'accesso all'ultimo modello GPT-4.