Quando un essere umano guarda una scena o un'immagine, lo capisce: quali oggetti ci sono e cosa sta succedendo se si sta svolgendo un'azione. Un computer, invece, elabora solo dati digitali che descrivono il valore del colore di ciascun pixel. Per un umano, riconoscere una pizza su un tavolo ingombra è facile. Ma fino a poco tempo fa, i computer non erano in grado di eseguire la stessa operazione.

La visione artificiale, o CV, consente a un computer di essere in grado di raccogliere informazioni importanti da input visivi e fare previsioni e raccomandazioni accurate basate su tali informazioni.

Come funziona la visione artificiale?

Prima della visione artificiale, per creare un programma che riconoscesse un'immagine particolare, una persona avrebbe dovuto fare ore di lavoro manuale con le gambe. In primo luogo, dovrebbe essere raccolto un database di immagini simili.

Quindi, queste immagini dovrebbero essere analizzate, misurate e annotate manualmente con dati rilevanti che il ricercatore pensava potesse identificare l'oggetto in questione (come colore, misure e forma). Solo allora è stato possibile utilizzare il software per fare previsioni.

instagram viewer

D'altra parte, la visione artificiale automatizza l'intero processo utilizzando un approccio di apprendimento automatico noto come deep learning. Il deep learning utilizza una rete neurale a più livelli con centinaia di potenziali strati. Nel caso delle immagini, di solito si tratta di una rete neurale convoluzionale (CNN).

Spiegare in dettaglio come funzionano il deep learning e le reti neurali va ben oltre lo scopo di questo articolo. Fondamentalmente, grandi quantità di dati vengono immesse nella rete neurale. La rete neurale analizza ripetutamente i dati fino a quando non può formare previsioni accurate al riguardo.

Nel caso di una CNN utilizzata per un compito di visione artificiale, la rete neurale prende i dati attraverso diversi passaggi. In primo luogo, comprime l'immagine in più parti (singoli pixel o gruppi di pixel contrassegnati in precedenza).

Quindi, fa previsioni su cosa c'è in diversi pezzi dell'immagine (come bordi netti o oggetti specifici). Controlla ripetutamente l'accuratezza di queste previsioni e ogni volta modifica leggermente parti dell'algoritmo fino a quando non diventa molto accurato.

I computer sono ora così potenti che possono analizzare un'immagine molto più velocemente del cervello umano, specialmente una volta che hanno imparato a riconoscere determinati schemi. In questo modo, è facile vedere come un algoritmo di deep learning possa superare le capacità umane.

Quali sono i tipi di visione artificiale?

La visione artificiale implica l'analisi e la comprensione delle immagini e l'output di previsioni o decisioni pertinenti sulle immagini. Ci sono vari compiti che la visione artificiale utilizzerà per raggiungere questi obiettivi. Alcuni di questi includono:

  • Classificazione dell'immagine: Il tipo di immagine viene riconosciuto. Ad esempio, che si tratti del viso, del paesaggio o di un oggetto di una persona. Questo tipo di attività può essere utilizzata per identificare e classificare rapidamente le immagini. Un uso per questo è nel riconoscere e bloccare automaticamente i contenuti inappropriati sui social media.
  • Riconoscimento oggetto: Simile alla classificazione delle immagini, il riconoscimento degli oggetti può identificare un particolare oggetto all'interno di una scena, come una pizza su un tavolo ingombra.
  • Rilevamento del bordo: Un uso comune della visione artificiale, e di solito il primo passo nel rilevamento degli oggetti, è identificare i bordi netti in un'immagine.
  • Identificazione dell'oggetto: Questo è il riconoscimento di singoli esempi di un oggetto o di un'immagine, come l'identificazione di una determinata persona, impronte digitali o veicolo.
  • Rilevamento di oggetti: Il rilevamento è l'identificazione di un particolare tratto all'interno di un'immagine, come un osso fratturato in una radiografia.
  • Segmentazione degli oggetti: Questa è l'identificazione di quali pixel nell'immagine appartengono all'oggetto in questione.
  • Monitoraggio oggetto: In una sequenza video, una volta che un oggetto è stato riconosciuto, può essere facilmente rintracciato nel video.
  • Restauro dell'immagine: Sfocatura, rumore e altri artefatti dell'immagine possono essere rimossi identificando con precisione dove si trova l'oggetto rispetto allo sfondo nell'immagine.

Esempi di visione artificiale

L'intelligenza artificiale è già utilizzato in diversi settori con un effetto sbalorditivo, che è vero per la computer vision. Ecco alcuni esempi di CV già utilizzati oggi.

Riconoscimento facciale

Il riconoscimento facciale è uno dei principali modi in cui viene utilizzata la visione artificiale oggi. Se confrontati con database di volti noti, gli algoritmi di visione artificiale possono identificare in modo molto accurato le singole persone.

  • I social media analizzano le immagini e taggano automaticamente gli utenti per i quali hanno una buona selezione di immagini.
  • Computer portatili, telefoni e dispositivi di sicurezza possono identificare le persone per consentire l'accesso.
  • Le forze dell'ordine utilizzano il riconoscimento facciale nei sistemi CCTV per identificare i sospetti.

Medicinale

La visione artificiale è attualmente utilizzata nel settore sanitario per fornire diagnosi più rapide e accurate di quelle che possono fare gli esperti. Molte applicazioni implicano l'analisi di immagini a raggi X, TC o MRI per condizioni particolari, tra cui malattie neurologiche, tumori e ossa rotte o fratturate.

Auto a guida autonoma

I veicoli autonomi devono comprendere l'ambiente circostante per guidare in sicurezza. Ciò significa riconoscere strade, corsie, segnali stradali, altri veicoli, pedoni e altro ancora. Tutte queste attività utilizzano sistemi di visione artificiale in tempo reale per evitare collisioni e guidare in sicurezza.

La visione artificiale è impegnativa

Le attuali applicazioni della computer vision stanno già iniziando a cambiare il modo in cui lavoriamo in vari settori. Dalla capacità di rilevare apparecchiature difettose o rotte alla diagnosi accurata del cancro, la visione artificiale ha la capacità di migliorare i sistemi e salvare vite umane.

Ma non è privo di sfide. La computer vision è ancora lontana da ciò che è la visione umana. Abbiamo migliaia di anni di evoluzione che ci consentono di riconoscere e comprendere quasi tutto ciò che accade intorno a noi in tempo reale. Ma non abbiamo idea di come il cervello umano svolga questi compiti.

Il deep learning è un enorme passo avanti nella giusta direzione, ma richiede comunque un'incredibile quantità di lavoro creare un sistema in grado di svolgere un compito che gli esseri umani possono svolgere molto facilmente, come identificare un'auto sul strada. Questo perché i computer eseguono attività vincolate in modo molto efficace. Sviluppare un computer in grado di comprendere la complessità totale del mondo visivo è un gioco completamente diverso.

Man mano che la ricerca viene svolta sia nelle applicazioni di intelligenza artificiale che nella biologia umana, è probabile che assisteremo a un'esplosione di possibili usi per la visione artificiale nel prossimo futuro.

E-mail
Cosa sono gli algoritmi di apprendimento automatico? Ecco come funzionano

Gli algoritmi di apprendimento automatico sono progettati per semplificare la vita e migliorare i sistemi, ma possono andare storto con conseguenze negative.

Leggi Avanti

Argomenti correlati
  • La tecnologia spiegata
  • Programmazione
  • Intelligenza artificiale
  • Reti neurali
Circa l'autore
Jake Harfield (16 Articoli Pubblicati)

Jake Harfield è uno scrittore freelance con sede a Perth, in Australia. Quando non scrive, di solito è fuori nella boscaglia a fotografare la fauna locale. Puoi visitarlo su www.jakeharfield.com

Altro da Jake Harfield

Iscriviti alla nostra Newsletter

Iscriviti alla nostra newsletter per consigli tecnici, recensioni, ebook gratuiti e offerte esclusive!

Ancora un passo…!

Conferma il tuo indirizzo e-mail nell'e-mail che ti abbiamo appena inviato.

.