Il riconoscimento vocale di IBM

 IBM ha recentemente annunciato di aver battuto il record di riconoscimento vocale, grazie alla creazione di una tecnologia in grado di riconoscere il parlato con una precisione sempre più simile alla comprensione umana.

Già nel 2016 IBM disse di essere in grado di effettuare il riconoscimento vocale con un margine di errore di solo il 6,9 per cento. Ora è arrivata al 5,5 per cento, con un miglioramento quindi del 20% rispetto a sei mesi fa.

IBM è da tempo significativamente impegnata nella ricerca e sviluppo di tecnologie in grado di governare le interazioni complesse fra voce, orecchio e cervello da applicare in futuro alle possibili forme di dialogo fra uomo e macchine.

Restiamo sui numeri per dare una indicazione del risultato raggiunto da IBM: è stato calcolato che il tasso di errore nella comprensione del parlato fra due esseri umani è del 5,1%. Questo valore viene preso come riferimento per misurare lo sviluppo dei risultati che si stanno ottenendo in questo campo. Di recente anche Microsoft aveva raggiunto un grande risultato abbassando il tasso di errore a solo il 5,9%. IBM ha ulteriormente abbassato questo limite.

Le ricerche IBM si avvalgono fortemente di Watson, il sistema di Intelligenza Artificiale sviluppato proprio per essere in grado di rispondere a domande espresse in linguaggio naturale.

Watson ufficialmente nasce con l’ambizioso obiettivo di trovare un fondamentale impiego in campo sanitario per divenire strumento di supporto alle decisioni cliniche, supportare il personale sanitario nell’analisi dei dati del paziente e nella elaborazione di soluzioni terapeutiche personalizzate.

“La capacità di riconoscere il discorso, così come fanno gli esseri umani è una sfida continua, dal momento che il linguaggio umano, in particolare durante la conversazione spontanea, è estremamente complesso” ha affermato Julia Hirschberg, professore e presidente del Dipartimento di Computer Science presso la Columbia University, la quale giudica “impressionanti” i recenti successi di IBM nel riconoscimento vocale.

Intelligenza Artificiale e reti neurali, sistemi di apprendimento e modelli acustici e linguistici sofisticati consentiranno all’uomo, forse in tempi molto ravvicinati, di dialogare con macchine e computer in modo sempre più naturale per noi e ci avvicineranno a traguardi fondamentali per l’umanità.

Oggi c’è l’esperienza comune con Siri, Alexa e Cortana, domani ci saranno altre soluzioni e queste saranno sicuramente connesse all’internet delle cose e alle esperienze quotidiane di ciascuno: le relazioni, la salute, l’istruzione, il lavoro e l’intrattenimento. Saremo sempre più immersi in una realtà fortemente interconnessa con la quale riusciremo anche a dialogare in modo corrente.