I generatori di arte AI hanno una cattiva reputazione per la produzione di rappresentazioni imprecise delle mani. Mettiamo Midjourney v5 contro Dall-E 2 per vedere quale funziona meglio.

I generatori di arte AI continuano a stupire, permettendoci di creare praticamente tutto ciò che possiamo immaginare. Tuttavia, la tecnologia sembra aver colpito un muro di mattoni quando si tratta di generare mani dall'aspetto realistico.

Qui, esaminiamo due delle principali app di arte generativa e le confrontiamo testa a testa o corpo a corpo per vedere quale può generare mani migliori, Midjourney v5 o Dall-E 2. Una di queste app ha imparato le mani? Scopriamolo!

Il problema dell'intelligenza artificiale con le mani

Da quando l'arte generata dall'intelligenza artificiale si è diffusa su Internet, ci sono state critiche riguardo al qualità delle mani disegnate da AI. Nonostante i recenti aggiornamenti, come mostrato nei nostri confronti fianco a fianco, i risultati non sono stati soddisfacenti.

Entrambi i contendenti hanno migliorato le loro capacità e la qualità dei loro risultati a ogni iterazione. L'ultimo aggiornamento,

instagram viewer
Versione 5 di Midjourney, ha mostrato progressi impressionanti. Tuttavia, il problema con le mani disegnate dall'IA rimane irrisolto e non può essere ignorato.

Confronto 1: utilizzo dei prompt "Mano" e "Mani"

I nostri confronti conterranno esattamente gli stessi prompt sia per Dall-E 2 che per Midjourney v5. Progetteremo i suggerimenti in modo che siano specifici della mano invece di creare semplicemente persone per vedere come appaiono le mani. Stiamo anche dando a ciascuna app solo una possibilità (tiro) per ogni richiesta.

Mano

Cominciamo con il prompt più semplice e pertinente: "mano".

A metà viaggio v5:

Dall-Mi 2:

Non siamo partiti bene!

Midjourney ha preso la strada insolita di associare una mano a situazioni piuttosto creative. Invece di concentrarci solo su una mano, vediamo un mago, guanti, uno scheletro e una minuscola statuetta. Anche all'immagine dei guanti manca un dito.

Dall-E 2 adotta l'approccio opposto e ci offre una sola mano su uno sfondo semplice. Ma stranamente, ci sono alcune strane posture, in particolare con i pollici, che non sembrano naturali o comode. Ogni mano è anche tagliata su uno dei lati delle immagini.

Chi vince questo round? Lo daremo a Dall-E 2 per la precisione complessiva.

Mani

Ora, rendiamo il prompt plurale, "mani", e vediamo cosa escogitano le IA.

A metà viaggio v5:

Dall-Mi 2:

Il tentativo di Midjourney di "hands" questa volta risulta migliore. Ma tutte e quattro le immagini sono in bianco e nero e ci mancano alcune dita. A un esame più attento, puoi anche vedere che alcune delle dita hanno una forma strana o si trasformano l'una nell'altra.

Dall-E 2 continua a presentare lancette con uno sfondo semplice. Non ci sono cifre mancanti, ma le mani sono ritagliate nella terza immagine e le altre versioni sembrano piuttosto goffe nella composizione e mancano del tutto di creatività.

Chiamiamo questo confronto un pareggio. Dall-E 2 vincerebbe per precisione se questo fosse l'unico fattore, ma Midjourney riesce a crearne alcuni belle immagini nelle sue interpretazioni in bianco e nero, anche se tutte e quattro le versioni non sono molto realistico.

Puoi sempre usa Photoshop per correggere la tua arte di Midjouney, comprese le mani.

Confronto 2: gesti delle mani

Confrontiamo un paio di gesti delle mani che sono quasi universalmente riconosciuti.

Dita incrociate

Per prima cosa, proviamo "incrociamo le dita".

A metà viaggio v5:

Dall-Mi 2:

È sicuro dire che Midjourney ha completamente fallito questo prompt. Ci mancano le dita e nessuna delle versioni sembra affatto naturale.

Tanto di cappello ancora una volta a Dall-E 2 per aver corretto il conteggio delle dita, ma questa è l'unica buona notizia. Ogni versione sembra che le dita stiano colpendo le proprie posizioni yoga in un gioco di Twister.

Non c'è vincitore in questo confronto.

Pollice su

Successivamente, andiamo con "pollice in su".

A metà viaggio v5:

Dall-Mi 2:

Midjourney ottiene il conteggio delle dita corretto trattando ogni suggerimento in modo creativo. Notate l'introduzione di uno stile illustrativo?

Dall-E 2 ottiene anche punti per la precisione senza cercare di scuotere la barca con qualcosa di creativo aggiunto a ogni risultato.

Non c'è un chiaro vincitore qui.

Confronto 3: mani con oggetti

Ora aumenteremo la complessità spingendo le mani a interagire con gli oggetti.

Mano che tiene la sfera di cristallo

Cominciamo con un oggetto casuale, usando il prompt "mano che tiene la sfera di cristallo".

A metà viaggio v5:

Dall-Mi 2:

Man mano che aumentiamo la complessità, Midjourney inizia a brillare. A parte un paio di interpretazioni che sembrano innaturali, le lancette e le sfere di cristallo sono bellissime. Midjourney impiega anche del tempo per creare riflessi nel vetro che sicuramente si aggiungono alla creatività complessiva.

Ma per la prima volta, vediamo Dall-E 2 mancare una cifra in almeno una delle mani, con la quarta mano che sembra semplicemente strana. Inoltre, le sfere di cristallo non sembrano così impressionanti rispetto a quelle di Midjourney.

Midjourney ottiene la sua prima vittoria.

Mano che tiene l'acqua

Proviamo qualcosa di ancora più complesso con il prompt "mano che tiene l'acqua".

A metà viaggio v5:

Dall-Mi 2:

Midjourney riesce a far rotolare solo un'immagine con il numero corretto di cifre. Sebbene reso magnificamente, ancora una volta iniziamo a vedere le crepe nel dipartimento di credibilità.

Anche Dall-E 2 fa fatica a ottenere mani naturali, ma fa un lavoro molto migliore. Cambia anche il colore sullo sfondo per una certa varietà.

Daremo questo round a Dall-E 2.

Confronto 4: Mani che lavorano

Per questo confronto, creeremo prompt che coinvolgono le mani nelle attività.

Mani che modellano l'argilla

Vediamo come se la cavano i modelli di intelligenza artificiale con "mani che modellano l'argilla".

A metà viaggio v5:

Dall-Mi 2:

Midjourney ha perso un dito in due immagini, ma tutto il resto sembra fantastico.

Le immagini di Dall-E 2 sembrano confuse e affollate, ricorrendo all'aggiunta delle mani di un'altra persona in metà delle versioni.

Il vantaggio va a Midjourney.

Mani che premono pasta

Proviamo un'attività simile, "mani che pressano la pasta".

A metà viaggio v5:

Dall-Mi 2:

Le immagini di Midjourney hanno un bell'aspetto nel complesso. Ma ancora una volta, metà di loro ha cifre mancanti. Ma le immagini non possono essere criticate per il loro stile artistico.

Le versioni di Dall-E 2 mancano anche delle dita in metà delle interpretazioni e ne aggiungono persino una all'ultima mano del set.

Chiamiamo questo un pareggio.

Se vuoi provare tu stesso questi confronti, te lo mostriamo come utilizzare Midjourney per creare arte AI.

Cosa ci dicono i risultati?

È divertente andare a fare confronti e determinare un vincitore assoluto. E se dovessimo scegliere, lo chiameremmo a favore di Midjourney v5. Anche se Dall-E 2 ha creato più spesso mani con il numero corretto di dita, è stato Midjourney a creare immagini più accattivanti e con una resa artistica.

Ma entrambe le app hanno un posto nel mercato per gli artisti che riutilizzano le immagini di Dall-E 2 e Midjourney per il loro lavoro. Entrambi sono in grado di creare mani che possono essere utilizzate come ritagli o in compositi per uso artistico, editoriale e commerciale. È solo una questione di preferenze personali.

L'intelligenza artificiale alla fine vincerà le mani

Le app di arte generativa come Dall-E 2 e Midjourney hanno fatto molta strada nella loro capacità di creare arte realistica e fantastica. Fanno ancora fatica a generare mani, ma data l'accelerazione della tecnologia generativa, possiamo solo aspettarci miglioramenti nel prossimo futuro.