Gli ingegneri di Google sarebbero al lavoro sull’applicazione dell’AI al fine di isolare le fonti acustiche e riconoscerle. Se pensate a quanto possa essere difficile per un essere umano riconoscere una voce tra tante, pensate quanto lo possa essere per un sistema automatico. Questa piccola riflessione può dare l’idea dell’impressionante lavoro svolto da Big G in quest’ottica.
Il sistema di riconoscimento di Google è basato sull’apprendimento automatico: scopriamo meglio come lavora l’AI
Come accennato – il sistema – riconosce chiaramente suoni specifici come il parlato, lavorando sotto diversi aspetti. Infatti non solo riesce ad evidenziare parole pronunciate isolandole dal rumore di fondo, ma riesce anche a distinguere il suono di una determinata voce dall’altra.
E’ stato molto particolare il metodo utilizzato da Google per “addestrare” la rete a riconoscere le singole fonti. Sono infatti stati allestiti dei “finti cocktail party” con dei rumori puliti, inviati singolarmente alla rete. Successivamente a questi si sono aggiunti dei rumori di sottofondo ed un video per addestrare il sistema ai movimenti facciali. Sovrapponendo il video alla traccia audio si possono determinare quali frequenze corrispondono ad una determinata fonte. Questo è il risultato finale.
Ovviamente la qualità della separazione dell’audio sarà maggiore se maggiore è la differenza tra le voci. L’implementazione di questa tecnologia, però, potrebbe portare ad un dibattito etico da non sottovalutare, soprattutto in seguito agli avvenimenti di questo periodo. Infatti se da un lato rappresenta un argomento molto affascinante, non si può rimanere indifferenti alle implicazioni negative che potrebbe portare.
Ovviamente queste rimangono delle congetture che potranno essere affrontate in maniera più dettagliata quando avremo più informazioni sull’argomento. Nel frattempo non ci resta che aspettare per conoscerne i reali sviluppi.
[su_app]