Scopri la potenza dell'API di OpenAI e tutte le possibilità che offre.
Il potere generativo di ChatGPT ha causato una frenesia nel mondo della tecnologia sin dal suo lancio. Per condividere l'intuizione dell'IA, OpenAI ha rilasciato le API ChatGPT e Whisper il 1° marzo 2023, affinché gli sviluppatori possano esplorare e consumare in-app.
Le API di OpenAI presentano molti endpoint preziosi che semplificano l'integrazione dell'IA. Esploriamo la potenza delle API OpenAI per vedere come possono esserti utili.
Cosa può fare l'API OpenAI?
IL API OpenAI pacchetti in una serie di utilità per i programmatori. Se intendi fornire AI in-app ogni giorno, OpenAI ti semplificherà la vita con le seguenti abilità.
Chiacchierata
L'endpoint di completamento della chat dell'API OpenAI aiuta l'utente finale a creare una sessione interattiva naturale e a misura d'uomo con un assistente virtuale utilizzando il modello GPT-3.5-turbo.
Nel backstage, la chiamata API utilizza una matrice di messaggi di ruoli e contenuti. Dal lato utente, il contenuto è un insieme di istruzioni per l'assistente virtuale, che coinvolge l'utente, mentre per il modello, il contenuto è la sua risposta.
Il ruolo di primo livello è il sistema, in cui si definisce la funzione complessiva dell'assistente virtuale. Ad esempio, quando il programmatore dice al sistema qualcosa come "sei un utile assistente virtuale", ti aspetti che risponda a varie domande nell'ambito della sua capacità di apprendimento.
Dopo aver detto che era "un utile assistente virtuale", ecco come è andata una delle nostre chat da riga di comando con il modello GPT-3.5-turbo:
Puoi persino migliorare le prestazioni del modello fornendo parametri come temperatura, penalità di presenza, penalità di frequenza e altro. Se hai mai utilizzato ChatGPT, sai già come funziona il modello di completamento della chat di OpenAI.
Completamento del testo
L'API di completamento del testo fornisce funzionalità di conversazione, inserimento di testo e completamento del testo basate su modelli GPT-3.5 avanzati.
Il modello campione nell'endpoint di completamento del testo è text-davinci-003, che è notevolmente più intuitivo dei modelli di linguaggio naturale GPT-3. L'endpoint accetta un prompt dell'utente, consentendo al modello di rispondere in modo naturale e completare frasi da semplici a complesse utilizzando un testo intuitivo.
Sebbene l'endpoint di completamento del testo non sia così intuitivo come l'endpoint della chat, migliora, man mano che si aumentano i token di testo forniti al modello text-davinci-003.
Ad esempio, abbiamo ottenuto alcuni completamenti a metà quando abbiamo posizionato il modello su max_tokens di sette:
Tuttavia, l'aumento di max_tokens a 70 ha generato pensieri più coerenti:
Discorso al testo
Puoi trascrivere e tradurre il discorso audio utilizzando gli endpoint di trascrizione e traduzione OpenAI. Gli endpoint di sintesi vocale si basano sul modello Whisper v2-large, sviluppato attraverso una supervisione debole su larga scala.
Tuttavia, OpenAI afferma che non c'è differenza tra il suo modello Whisper e quello in open-source. Quindi offre infinite opportunità per integrare un trascrittore multilingue e un traduttore AI nella tua app su larga scala.
L'utilizzo dell'endpoint è semplice. Tutto quello che devi fare è fornire al modello un file audio e chiamare il file openai. Audio.translate O openai. Audio.trascrizione endpoint per tradurlo o trascriverlo rispettivamente. Questi endpoint accettano una dimensione file massima di 25 MB e supportano la maggior parte dei tipi di file audio, inclusi mp3, mp4, MPEG, MPGA, m4a, wav e webm.
Confronto testuale
L'endpoint di confronto del testo dell'API OpenAI misura la relazione tra i testi utilizzando il modello text-embedding-ada-002, un modello di incorporamento di seconda generazione. L'API di incorporamento utilizza questo modello per valutare la relazione tra i testi in base alla distanza tra due punti vettoriali. Più ampia è la differenza, meno correlati sono i testi messi a confronto.
L'endpoint di incorporamento include raggruppamento di testo, differenze, pertinenza, suggerimenti, opinioni e classificazione. Inoltre, addebita per volume di token.
Sebbene la documentazione di OpenAI affermi che puoi utilizzare gli altri modelli di incorporamento di prima generazione, il primo è migliore con un prezzo più conveniente. Tuttavia, OpenAI avverte che il modello di incorporamento potrebbe mostrare pregiudizi sociali nei confronti di determinate persone, come dimostrato nei test.
Completamento del codice
L'endpoint di completamento del codice è basato su OpenAI Codex, un insieme di modelli addestrati utilizzando il linguaggio naturale e miliardi di righe di codice da repository pubblici.
L'endpoint è in beta limitata e gratuito al momento della scrittura, offrendo supporto per molti linguaggi di programmazione moderni, inclusi JavaScript, Python, Go, PHP, Ruby, Shell, TypeScript, Swift, Perl e SQL.
Con il modello code-davinci-002 o code-cushman-001, l'endpoint di completamento del codice può inserire automaticamente righe di codice o avviare blocchi di codice dal prompt di un utente. Mentre il secondo modello è più veloce, il primo è il motore dell'endpoint, in quanto presenta inserimenti di codice per il completamento automatico del codice.
Ad esempio, puoi generare un blocco di codice inviando un prompt all'endpoint nel commento della lingua di destinazione.
Ecco alcune risposte che abbiamo ottenuto quando abbiamo provato a generare alcuni blocchi di codice in Python e JavaScript tramite il terminale:
Generazione di immagini
Questa è una delle funzionalità più intuitive dell'API OpenAI. Basata sul modello di immagine DALL.E, la funzionalità di immagine dell'API OpenAI presenta endpoint per la generazione, la modifica e la creazione di variazioni di immagine da prompt in linguaggio naturale.
Sebbene non disponga ancora di funzionalità avanzate come l'upscaling poiché è ancora in versione beta, i suoi output non ridimensionati sono più impressionanti di quelli generativi modelli artistici come Midjourney e diffusione stabile.
Mentre raggiungi l'endpoint di generazione dell'immagine, devi solo fornire un prompt, la dimensione dell'immagine e il conteggio dell'immagine. Ma l'endpoint di modifica delle immagini richiede di includere l'immagine che desideri modificare e una maschera RGBA che contrassegna il punto di modifica oltre agli altri parametri.
L'endpoint della variazione, d'altra parte, richiede solo l'immagine di destinazione, il conteggio della variazione e la dimensione dell'output. Al momento della scrittura, gli endpoint delle immagini beta di OpenAI possono accettare solo frame quadrati nell'intervallo 256x256, 512x512 e 1024x1024 pixel.
Abbiamo creato una semplice applicazione per la generazione di immagini utilizzando questo endpoint e, sebbene mancasse di alcuni dettagli, ha dato un risultato incredibile:
Come utilizzare l'API OpenAI
L'utilizzo dell'API OpenAI è semplice e segue il modello di consumo API convenzionale.
- Installa il openai pacchetto usando pip: pip installa openai.Se invece usi Node, puoi farlo usando npm: npm installa openai.
- Prendi le tue chiavi API: Accedi alla dashboard di OpenAI e fai clic sull'icona del tuo profilo in alto a destra. Vai a Visualizza le chiavi API e clicca Crea una nuova chiave segreta per generare la tua chiave segreta API.
- Effettua chiamate API agli endpoint del modello scelto tramite un linguaggio lato server come Python o JavaScript (nodo). Inseriscili nelle tue API personalizzate e testa i tuoi endpoint.
- Poi recuperare API personalizzate tramite JavaScript framework come React, Vue o Angular.
- Presenta i dati (richieste degli utenti e risposte del modello) in un'interfaccia utente visivamente accattivante e la tua app è pronta per l'uso nel mondo reale.
Cosa puoi creare con l'API OpenAI?
Le API OpenAI creano punti di ingresso per l'utilizzo nella vita reale dell'apprendimento automatico e dell'apprendimento per rinforzo. Mentre le opportunità per la creatività abbondano, ecco alcuni di ciò che puoi creare con le API OpenAI:
- Integra un chatbot di assistente virtuale intuitivo nel tuo sito Web o nella tua applicazione utilizzando l'endpoint di completamento della chat.
- Crea un'app di modifica e manipolazione delle immagini in grado di inserire naturalmente un oggetto in un'immagine in qualsiasi punto specificato utilizzando gli endpoint di generazione dell'immagine.
- Crea un modello di machine learning personalizzato da zero utilizzando l'endpoint di fine tuning del modello di OpenAI.
- Correggi sottotitoli e traduzioni per video, audio e conversazioni dal vivo utilizzando l'endpoint del modello di sintesi vocale.
- Identifica i sentimenti negativi nella tua app utilizzando l'endpoint del modello di incorporamento OpenAI.
- Crea plug-in di completamento del codice specifici del linguaggio di programmazione per editor di codice e ambienti di sviluppo integrati (IDE).
Crea all'infinito con le API OpenAI
La nostra comunicazione quotidiana comporta spesso lo scambio di contenuti scritti. L'API OpenAI estende solo le sue tendenze creative e il suo potenziale, con casi d'uso del linguaggio naturale apparentemente illimitati.
È ancora presto per l'API OpenAI. Ma aspettati che si evolva con più funzionalità con il passare del tempo.