Tehnologiile Google care permit izolarea vocilor din mulţime: Sunetele ambientale sunt blocate

Încercând să găsească o soluţie la această problemă surprinzător de complicată pentru un sistem computerizat, Google a recurs la tehnologii de inteligenţă artificială pentru a imita ceea ce oamenii reuşesc practic fără efort, respectiv să identifice şi izoleze voci din mulţime privind doar la persoana respectivă în timp ce vorbeşte.

Pentru a demonstra eficienţa noului filtru AI, echipa de dezvoltatorii a folosit scenariul unei spectacol de comedie în care doi participanţi vorbesc simultan în timp ce publicul aclamă în fundal. Redus la un simplu reglaj stânga-dreapta, filtrul poate împărţi sunetul în coloane sonore distincte, câte una pentru fiecare voce identificată din imagine. Remarcabil este cum zgomotul ambiant este anulat în întregime, iar vocea selectată este păstrată chiar şi în momentele când persoana ascultată îşi acoperă parţial faţa gesticulând din mâini.

Lasă un răspuns