Probabilmente hai visto app che affermano di tradurre ciò che dice il tuo gatto. Ma possono davvero tradurre il miagolio del tuo gatto in inglese? La risposta breve è sì, più o meno. È difficile a causa di quanto sia unico il "linguaggio" di ogni gatto, ma possono avvicinarsi molto alla tecnologia moderna.

Le app di traduzione di gatti come MeowTalk utilizzano una forma di riconoscimento vocale che enfatizza l'apprendimento automatico. Diamo un'occhiata più da vicino.

Riconoscimento vocale e apprendimento automatico

Mary Theresa McLean /Pixabay

Il riconoscimento vocale funziona registrando il parlato e trasformando l'audio in un file di dati digitali. Codifica dati come altezza e volume come punti dati che l'app può analizzare e abbinare ai significati. Microfoni DPA spiega che questi punti dati possono avere un aspetto molto diverso a seconda dei suoni di sottofondo e di come viene pronunciata una parola.

A volte diamo per scontato il riconoscimento vocale, ma è un'incredibile impresa tecnologica. Soprattutto considerando quanto sia complesso il linguaggio umano. Come

instagram viewer
Lo scienziato spiega, ogni parola implica un'ampia gamma di suoni o "fonemi" fusi l'uno nell'altro. Ottenere un computer per capire il parlato è molto difficile. La nuova frontiera dei suoni dei gatti sarà ancora più difficile.

Le app che utilizzano il riconoscimento vocale sono programmate con un "vocabolario" di parole chiamato set di dati. L'app quindi abbina il tuo discorso all'opzione più vicina nel suo vocabolario di dati.

Quando commette un errore, lo correggi e salva i dati per la prossima volta. Questo fa parte dell'apprendimento automatico. È il modo in cui un programma impara a riconoscere il parlato anche quando non è identico al set di dati con cui è iniziato.

Relazionato: Cosa sono gli algoritmi di machine learning? Ecco come funzionano

Il riconoscimento vocale ha ancora problemi, soprattutto con problemi di linguaggio e accenti. Alcune aziende lo sono migliorare l'apprendimento automatico per superare questi problemi, anche se. Nel tempo, l'apprendimento automatico può trasformare il riconoscimento vocale in uno strumento potente.

È così che funziona il riconoscimento vocale per gli esseri umani. Ma funziona per i gatti?

Riconoscimento vocale vs. Riconoscimento del miao

Ariana Suárez /Unsplash

Per prima cosa, dobbiamo capire perché tradurre un certo tipo di miagolio come "Ho fame" è diverso dall'analizzare il linguaggio umano. Il problema è principalmente che la comunicazione del gatto si basa maggiormente su segnali non verbali come la postura. Un altro problema è l'assenza di un "linguaggio felino" universale.

Secondo il ASPCA, i gatti selvatici adulti non miagolano mai l'un l'altro, solo con le persone. Altre ricerche di la Humane Society aggiunge che quei suoni "non si verificano nel vuoto". Dobbiamo interpretarli insieme al linguaggio del corpo e ad altri contesti. In molti casi, questi segnali silenziosi sono l'unica differenza tra un miagolio che significa "ho fame" e uno che significa "voglio giocare".

In aggiunta a questo problema, non esistono due gatti con la stessa lingua. I gatti sviluppano "linguaggi" personalizzati per i loro proprietari. Questi si basano in parte sull'imitazione della voce del proprietario e in parte sulla personalità del gatto. Non esistono due gatti che suonano allo stesso modo, anche quando trasmettono lo stesso desiderio o bisogno. Quindi come si traduce il vocabolario vocale di un'app per tutte?

Apprendimento automatico flessibile per gatti

Suoni gratuiti /Unsplash

Sebbene ad alcuni assistenti virtuali piaccia Oto tentativo di comprendere il tono e le emozioni, il riconoscimento vocale è ancora terribile ai segnali non verbali. Ma questo non significa che sia impossibile interpretarli.

MeowTalk utilizza un tipo più flessibile di apprendimento automatico per aiutare a superare questi problemi.

Scarica: MeowTalk per Android | iOS (Gratuito)

Meowtalk è stato creato da Javier Sanchez, che ha anche lavorato nel team di Alexa. Ha immaginato l'app come un passo verso i collari intelligenti. Questi collari tradurranno i suoni dei gatti in parole umane, attingendo a complesse strategie di apprendimento automatico per aiutare gli esseri umani a comprendere meglio e prendersi cura dei loro gatti.

Il team di MeowTalk ha compensato i problemi di unicità creando profili più specifici per ogni gatto. Nell'app, registri ogni gatto separatamente. Science Norvegia segnala che i gattini miagolano in modo diverso rispetto ai gatti adulti, quindi l'app richiede anche il compleanno del gatto. Ogni profilo genera una rete dati unica per il gatto, incorporando un po 'di apprendimento profondo nell'apprendimento automatico.

Relazionato: Apprendimento profondo vs. Machine learning vs. AI: come vanno insieme?

Per il vocabolario, MeowTalk inizia con 10 profili audio nel suo set di dati. Ognuno ha un significato diverso allegato, come "felice" o "caccia". Quando l'app sente un suono e lo sbaglia, puoi correggerlo o creare una nuova interpretazione.

Dati CATSOUNDS raccolti da Akvelon

La correzione indica all'app di sostituire il vocabolario di base con il nuovo suono.

Ad esempio, puoi dire all'app di abbinare "Caccia" a brevi cinguettii invece che a un lungo urlo. Questo tipo di correzione è più utile dell'aggiunta di più suoni per abbinarli a un significato nel modo in cui funziona il riconoscimento vocale, il che sarebbe come dire all'app che un lungo ululato e un breve cinguettio entrambi significa "Mother Call".

L'apprendimento automatico nelle app di riconoscimento vocale di solito resiste a questo tipo di sovrascrittura. Sarebbe come cercare di insegnare a Siri che quando dici "blog di tecnologia", intendi davvero "pera". Ma la forma più flessibile di apprendimento automatico che MeowTalk utilizza può gestire maggiormente questa correzione facilmente.

La creazione di una nuova interpretazione aggiunge un significato che non era codificato in precedenza. Ad esempio, se il tuo gatto ha una chiamata specifica quando vuole il suo giocattolo preferito, puoi aggiungere "Voglio il mio topo" come opzione. È simile all'aggiunta di una parola al dizionario di correzione automatica.

Relazionato: Come definire le tue parole di correzione automatica su Android

Nel tempo, puoi sviluppare un profilo vocale altamente personalizzato per il tuo gatto. Alla fine, potrebbe anche essere abbastanza sofisticato da essere utile ai pet-sitter o per risolvere problemi comportamentali. Se non altro, aiuta i proprietari di gatti a diventare più attenti ai loro animali domestici.

Il verdetto: le app di traduzione di gatti funzionano?

Alla fine, la "traduzione del gatto" si basa ancora molto sul fatto che l'utente insegni all'app come parla il proprio gatto. Probabilmente sarà sempre così a causa di quanto sia unica la comunicazione di ogni gatto.

Ma il fatto che l'apprendimento automatico sia arrivato così lontano che gli sviluppatori possano riuscirci anche parzialmente è incredibile. L'apprendimento automatico e l'intelligenza artificiale stanno avanzando a velocità vertiginose e non vediamo l'ora di vedere dove andranno dopo.

E-mail
Argomenti correlati
  • Spiegazione della tecnologia
  • Apprendimento delle lingue
  • Apprendimento automatico
Circa l'autore
Natalie Stewart (16 articoli pubblicati)

Natalie Stewart è una scrittrice per MakeUseOf. Si è interessata per la prima volta alla tecnologia al college e ha sviluppato una passione per la scrittura sui media all'università. L'attenzione di Natalie è sulla tecnologia accessibile e facile da usare e adora le app e i dispositivi che semplificano la vita alle persone comuni.

Altro di Natalie Stewart

Iscriviti alla nostra Newsletter

Iscriviti alla nostra newsletter per suggerimenti tecnici, recensioni, ebook gratuiti e offerte esclusive!

Ancora un passo…!

Conferma il tuo indirizzo e-mail nell'e-mail che ti abbiamo appena inviato.

.