Mettiamo l'uno contro l'altro i più grandi giocatori di arte dell'IA e vediamo quale esce in cima. DALL-E, Midjourney o diffusione stabile?
L'intelligenza artificiale ha fatto molta strada nel campo della generazione di immagini. App generative come DALL-E, Midjourney e Stable Diffusion hanno avuto un profondo effetto sul modo in cui interagiamo con i contenuti digitali.
In questo articolo, confronteremo ogni app per vedere quale è complessivamente migliore nella generazione di immagini basate su prompt di testo. Iniziamo!
DALL-E 2
DALL-E 2 ha un'interfaccia semplice che è facile da capire ed è facile iniziare a generare immagini senza doversi registrare con una piattaforma di terze parti. Basta andare sul sito Web e inserire il testo nel file creare casella per creare un'immagine. DALL-E 2 produrrà quindi quattro versioni del prompt, che puoi modificare o scaricare.
Caratteristica eccezionale
Una caratteristica distintiva di DALL-E 2 è la capacità di creare, modificare e fondere più immagini insieme. Dopo aver selezionato l'immagine desiderata e fare clic
Modificare, avrai la possibilità di utilizzare il Aggiungi frame di generazione funzionalità per aggiungere ulteriori generazioni di immagini a quella esistente.Una volta posizionato il frame, inserisci un nuovo prompt e DALL-E 2 genererà un nuovo set di immagini con la possibilità di fonderne una qualsiasi nell'immagine originale.
È quindi possibile utilizzare una qualsiasi delle funzioni di modifica per creare l'immagine alla perfezione. Ad esempio, puoi utilizzare il Cancellare strumento per cancellare i pixel esistenti e quindi inserire il nuovo testo nella casella Genera per riempirlo. Puoi farlo più volte per ottenere i risultati desiderati.
Ma ricorda che ogni volta che fai clic su Genera, usi i crediti. E una volta utilizzata la tua assegnazione, dovrai acquistare altri crediti per continuare.
Professionisti
- Facile da usare
- Molta flessibilità creativa
- Nessuna piattaforma di terze parti necessaria
Contro
- Immagini semplicistiche
- Non un alto grado di precisione
- Può creare solo immagini quadrate
Copriamo il basi di DALL-E 2 se non l'hai mai usato prima.
A metà viaggio
A metà viaggio è discutibile il generatore di testo in immagine AI da battere. Con il suo potente set di funzionalità, è in grado di produrre immagini altamente artistiche e credibili che altri concorrenti IA devono ancora ottenere in modo coerente. Ma a differenza di DALL-E 2, devi creare un account Discord prima di iniziare a usarlo.
Anche con i livelli di complessità aggiunti e nonostante il fatto che devi digitare comandi come /imagine per generare le tue immagini, perdonerai presto Midjourney a causa della bellissima arte che puoi creare con poche parole.
Come con DALL-E 2, vengono create quattro versioni e puoi selezionarne una o più per scaricarle o creare varianti. Ma c'è più flessibilità con i rapporti di immagine; puoi creare qualsiasi rapporto che preferisci aggiungendo ogni immagine con --ar e poi seguito dal rapporto, nel nostro esempio, 3:2.
La qualità dei risultati è inconfondibile Magia di Midjourney.
Caratteristica eccezionale
Una delle funzionalità più entusiasmanti e potenti di Midjourney è la possibilità di caricare le proprie immagini e quindi fare in modo che Midjourney crei prompt per esse che è possibile utilizzare per creare immagini completamente nuove. Digitando /describe, ti viene chiesto di caricare una delle tue immagini.
Una volta caricato, Midjourney offrirà quattro suggerimenti con la propria interpretazione di ciò che sta vedendo.
È quindi possibile utilizzare questi prompt per creare un set di immagini completamente diverso.
Con così tanta flessibilità creativa, Midjourney offre possibilità quasi infinite.
Professionisti
- Immagini di alta qualità
- Gli utenti possono programmare rapporti personalizzati
- Molta flessibilità per controllare i parametri dell'immagine
Contro
- Più complicato da usare
- Richiede agli utenti di registrarsi con Discord
- Il tempo di generazione delle immagini aumenta notevolmente dopo che le ore Fast sono esaurite
Puoi crea splendidi sfondi per i ritratti utilizzando Midjourney per far risaltare le tue foto.
Diffusione stabile
Stable Diffusion rappresenta il selvaggio West delle applicazioni di intelligenza artificiale generativa. Con molte applicazioni basate sul Web e opzioni di installazione disponibili, non è facile confrontare Stable Diffusion con DALL-E 2 e Midjourney. Ciò è dovuto principalmente alla disparità tra le versioni Web e i modelli di installazione per quanto riguarda le opzioni e la qualità dell'output. In altre parole, le versioni di Stable Diffusion installate generalmente ti daranno risultati molto migliori e libertà creativa.
Daremo un'occhiata al sito web ufficiale di Stable Diffusion, DreamStudio di Stability AIe mostrarti come iniziare a utilizzare l'app per darti un'idea di base delle sue capacità.
Il layout di Stable Diffusion in DreamStudio è più disordinato rispetto a DALL-E 2 e Midjourney, ma è comunque facile da usare. Gli utenti di prova ottengono 200 crediti gratuiti per creare prompt, che vengono inseriti nel file Richiesta scatola. Ma in aggiunta, c'è anche un Prompt negativo casella in cui puoi anticipare la diffusione stabile per tralasciare le cose.
Ci sono molte altre caratteristiche essenziali nel menu a sinistra da considerare che avranno un impatto sull'immagine complessiva e sull'utilizzo del credito. C'è un Stile casella delle opzioni, Carica immagine, E Impostazioni (per il rapporto e il numero di immagini da generare). Nel Avanzate scheda, c'è Forza immediata, Passi di generazione, Seme, E Modello.
Quando passi il mouse su ciascuna di queste opzioni, c'è una breve descrizione di ciascuna funzione. Ma per capire veramente cosa fa ognuno di loro in pratica, devi solo provarli. Ma tieni d'occhio i tuoi crediti perché questo non è un sistema di un credito per un'immagine.
Caratteristica eccezionale
IL Prompt negativo è probabilmente la caratteristica principale di Stable Diffusion di DreamStudio. È anche presumibilmente uno strumento straordinario in altre versioni di Stable Diffusion che aiuta con la qualità complessiva dell'immagine. In quelle versioni, la digitazione di affermazioni negative aiuta gli algoritmi a produrre immagini più accurate e di qualità superiore.
Quando i prompt negativi funzionano, funzionano bene. Ma spenderai crediti cercando di perfezionare l'aspetto che desideri in molti casi.
Professionisti
- Molteplici opzioni per le versioni web e installate
- Più libertà creativa (puoi creare immagini non censurate su alcune versioni)
- Un sacco di controlli per personalizzare i parametri dell'immagine
Contro
- Brucia i crediti nelle versioni a pagamento
- Ripida curva di apprendimento
- La qualità dell'immagine è molto incostante, a seconda della versione che hai
Se hai bisogno di aiuto con la creazione di prompt, te lo mostriamo come utilizzare ChatGPT per creare immagini AI.
Qual è l'app migliore?
Quindi qual è la migliore app, DALL-E 2, Midjourney o Stable Diffusion? È una domanda difficile perché gli utenti avranno aspettative diverse e ci sono diverse versioni di queste app che rendono irrealistici i confronti diretti. Tuttavia, possiamo valutare ciascuno dei nostri esempi in base a queste categorie.
Classifica della qualità dell'immagine
Midjourney ha prodotto le immagini di migliore qualità nei nostri esempi. Erano più realistici e resi meglio di DALL-E 2 e Stable Diffusion.
Facilità d'uso
Fuori dagli schemi, DALL-E 2 era il più facile da usare. Non richiedeva l'utilizzo di un'app di terze parti e il menu era semplice e semplificato.
Caratteristiche e capacità
Midjourney supera i suoi concorrenti perché ha più funzioni e capacità che producono immagini di alta qualità in modo più coerente.
Velocità
DALL-E 2 produce le immagini più velocemente (circa 12 secondi), superando Stable Diffusion di circa un secondo e Midjourney (in modalità Fast) con un margine maggiore.
Flessibilità e personalizzazione
Stable Diffusion è in una classe a sé stante per flessibilità e personalizzazione. Esiste un numero crescente di versioni che consentono agli utenti non solo di creare immagini solitamente censurate, ma ci sono versioni che producono persino immagini di alta qualità direttamente modellate da Midjourney immagini.
Midjourney e DALL-E 2 sono al primo posto nel numero di categorie vinte, ma il vincitore assoluto dovrebbe andare a Midjourney, solo in base alla qualità dell'immagine.
Con l'intensificarsi della concorrenza, gli utenti di contenuti AI sono serviti meglio
Il massimo che possiamo offrire è un'istantanea delle migliori prestazioni tra DALL-E 2, Midjourney e Stable Diffusion, in un dato momento. Il campo della tecnologia dell'intelligenza artificiale è in continua evoluzione, con numerosi contendenti che si uniscono al mercato ogni giorno. Ciò è estremamente vantaggioso per gli utenti di applicazioni di intelligenza artificiale generativa, in quanto favorisce l'innovazione e porta a costi ridotti per tutti noi per accedere a questi incredibili strumenti creativi.