Ci sono alcune differenze fondamentali tra il vecchio modello GPT-3.5 e il nuovo brillante modello GPT-4.

Dopo tutte le speculazioni e le affermazioni riguardanti le capacità di GPT-4, la tanto attesa quarta iterazione della famiglia di modelli linguistici GPT è stata lanciata il 14 marzo 2023.

GPT-4 non è arrivato con alcune delle caratteristiche tanto pubblicizzate che si diceva avesse. Tuttavia, l'ultimo modello migliora notevolmente GPT-3.5 e i suoi predecessori. Ma in che modo GPT-4 è diverso da GPT-3.5? Ti illustreremo alcune differenze chiave tra GPT-4 e GPT-3.5.

1. GPT-4 contro GPT-3.5: Creatività

Uno dei vantaggi più evidenti del modello GPT-4 rispetto a GPT-3.5 è la sua capacità di fornire risposte più creative ai prompt. Non fraintendermi; GPT-3.5 è molto creativo. C'è una lunga lista di cose creative che puoi fare con ChatGPT che utilizza il modello. Tuttavia, supera già molti grandi modelli linguistici in termini di creatività.

Tuttavia, GPT-4 alza ulteriormente l'asticella. Sebbene il vantaggio creativo di GPT-4 possa non essere evidente quando si tenta di risolvere problemi di base, la differenza in la creatività tra i due modelli diventa evidente man mano che il compito diventa più difficile e richiede un livello più elevato di creatività.

instagram viewer

Ad esempio, se chiedi a entrambi i modelli di completare un'attività creativa come scrivere una poesia utilizzando sia l'inglese che il francese su ogni riga della poesia, ChatGPT basato sull'ultimo modello GPT-4 darà risultati migliori. Mentre la risposta di GPT-4 utilizzerebbe entrambe le lingue su ogni riga, GPT-3.5 si alternerebbe invece tra le due lingue, con ciascuna riga che utilizza una lingua e la successiva che utilizza l'altra.

2. GPT-4 contro GPT-3.5: immagini o input visivi

Mentre GPT-3.5 può accettare solo prompt di testo, GPT-4 è multimodale e può accettare sia input testuali che visivi. Per essere chiari, quando diciamo input visivi, l'immagine non deve essere l'immagine di un prompt digitato: può essere l'immagine di qualsiasi cosa. Quindi, da un'immagine di un problema di matematica scritto a mano ai meme di Reddit, GPT-4 può comprendere e descrivere quasi tutte le immagini.

A differenza di GPT-3, GPT-4 è sia un linguaggio che un modello visivo.

Durante il live streaming dell'annuncio GPT-4, un ingegnere OpenAI ha fornito al modello uno screenshot di un server Discord. GPT-4 potrebbe descrivere ogni dettaglio su di esso, inclusi i nomi degli utenti online in quel momento. Al modello è stata anche fornita un'immagine di un mockup disegnato a mano di un sito Web di barzellette con le istruzioni per trasformalo in un sito Web e, sorprendentemente, GPT-4 ha fornito un codice funzionante per un sito Web che corrispondeva a Immagine.

3. GPT-4 contro GPT-3.5: Risposte più sicure

Sebbene GPT-4 non sia perfetto, le misure che adotta per garantire risposte più sicure sono un gradito aggiornamento rispetto a quello del modello GPT-3.5. Con GPT-3.5, OpenAI ha adottato un approccio alla sicurezza più basato sulla moderazione. In altre parole, alcune delle misure di sicurezza sono state più che altro un ripensamento. OpenAI ha monitorato ciò che gli utenti hanno fatto e le domande che hanno posto, ha identificato i difetti e ha cercato di risolverli in movimento.

Con GPT-4, la maggior parte delle misure di sicurezza è già integrata nel sistema a livello di modello. Per capire la differenza, è come costruire una casa con materiali robusti fin dall'inizio piuttosto che usare qualsiasi cosa vada bene e poi provare a rattoppare le cose man mano che emergono i difetti. Secondo Rapporto tecnico GPT-4 di OpenAI [PDF], GPT-4 produce risposte tossiche solo lo 0,73% delle volte rispetto al 6,48% di risposte tossiche di GPT-3.5.

4. GPT-4 contro GPT-3.5: Fattualità della risposta

Uno dei difetti di GPT-3.5 è la sua tendenza a produrre con sicurezza informazioni prive di senso e non veritiere. Nel gergo dell'IA, questo si chiama "allucinazione dell'IA" e può causare sfiducia nelle informazioni generate dall'IA.

​​​​​​

In GPT-4, l'allucinazione è ancora un problema. Tuttavia, secondo il rapporto tecnico GPT-4, il nuovo modello ha dal 19% al 29% in meno di probabilità di avere allucinazioni rispetto al modello GPT-3.5. Ma non si tratta solo della relazione tecnica. Le risposte del modello GPT-4 su ChatGPT sono notevolmente più concrete.

5. GPT-4 contro GPT-3.5: finestra contestuale

Una differenza meno discussa tra GPT-4 e GPT-3.5 è la finestra del contesto e la dimensione del contesto. Una finestra di contesto è la quantità di dati che un modello può conservare nella sua "memoria" durante una sessione di chat e per quanto tempo. GPT-4 ha una dimensione e una finestra del contesto significativamente migliori rispetto al modello precedente.

In termini pratici, ciò significa che GPT-4 può ricordare meglio il contesto di una conversazione più a lungo, così come le istruzioni fornite durante la conversazione.

Un problema con GPT-3.5 è la propensione del modello ad andare fuori tema o a non seguire le istruzioni man mano che avanzi nel corso di una conversazione. Potresti, ad esempio, dire alla modella di chiamarti con il tuo nome, e lo farebbe per un po', ma poi non seguirebbe le istruzioni lungo il percorso. Sebbene questo problema esista ancora con il modello GPT-4, è meno problematico a causa di una migliore finestra di contesto.

Un altro problema è la limitazione del volume di testo che è possibile utilizzare contemporaneamente in un prompt. Riepilogare un testo lungo utilizzando GPT-3 in genere significa suddividere il testo in più blocchi e riassumerli poco a poco. Il miglioramento della lunghezza del contesto nel modello GPT-4 significa che puoi incollare interi PDF in una volta sola e ottenere il riepilogo del modello senza suddividerlo in blocchi.

GPT-4: un passo avanti rispetto a GPT-3.5

Indubbiamente, GPT-4 è un significativo passo avanti rispetto ai modelli precedenti. Sebbene sia ancora afflitto da alcune delle limitazioni di GPT-3.5, miglioramenti significativi in ​​​​diverse aree e il L'aggiunta di nuove funzionalità rende il modello un nuovo entusiasmante passo nella ricerca di un linguaggio AI veramente intelligente Modelli.