Ascultă Radio România Actualitaţi Live

Sistem AI capabil să genereze chipurile oamenilor după ce le ascultă vocea

Cercetătorii de la MIT au conceput un sistem de inteligenţă artificială capabil să genereze o imagine digitală a unei persoane doar în funcţie de vocea acesteia.

Foto: maxpixel.net.

Articol de Răzvan Stancu, 16 Iunie 2019, 12:58

Cercetători americani de la MIT CSAIL (Computer Science & Artificial Intelligence Laboratory) au conceput un sistem de inteligenţă artificială (AI) capabil să genereze o imagine digitală a unei persoane doar în funcţie de vocea acesteia, ascultând o scurtă înregistrare audio cu respectiva persoană, informează LiveScience care citează un studiu publicat la sfârşitul lunii trecute în jurnalul arXiv şi nu au fost încă evaluate în sistemul peer-review.

Denumit Speech2Face, acest sistem este o reţea neuronală - un computer care gândeşte într-un mod similar cu un creier uman - şi a fost 'antrenat' de oamenii de ştiinţă folosind milioane de clipuri video educaţionale de pe internet în care vorbesc peste 100.000 de oameni diferiţi.

Pornind de la această bază de date, Speech2Face a învăţat să facă asociaţii între timbrul vocii şi anumite trăsături ale feţei. Apoi sistemul AI a fost folosit pentru a genera faţa care corespunde unei anumite înregistrări audio.

Deocamdată sistemul AI nu ştie cu exactitate cum arată un individ pornind doar de la sunetul vocii acestuia, însă reţeaua neuronală recunoaşte anumite caracteristici ale vocii care definesc în principal genul, vârsta şi etnia, elemente generale pentru mari categorii de oameni, conform autorilor sistemului.

'Astfel, acest model va produce chipuri care arată generic. El nu va produce imagini ale anumitor indivizi', notează oamenii de ştiinţă.

Chipurile generate de Speech2Face privesc drept înainte şi au expresii neutre. Ele nu corespund exact persoanelor ale căror voci au fost analizate în cadrul studiului. Cu toate acestea, sistemul identifică de obicei în mod curent categoria de vârstă a subiectului a cărui voce a analizat-o, etnia şi genul său.

Confruntat cu variaţii de limbă, sistemul AI a fost însă uşor de păcălit. Spre exemplu, când a ascultat o persoană asiatică vorbind în chineză, sistemul a generat figura unui asiatic. Însă atunci când aceeaşi persoană a vorbit în engleză, sistemul a fost păcălit şi a generat imaginea unei persoane caucaziene.

De asemenea, sistemul şi-a demonstrat limitele şi în ceea ce priveşte interpretarea genului persoanei în funcţie de tonalităţile vocii. Astfel, AI-ul a asociat vocile mai groase, mai grave, cu subiecţi de sex masculin şi vocile mai subţiri, cu tonalităţi mai ridicate cu subiecţi de genul feminin, asociere care nu este de fiecare dată corectă.

Conform cercetătorilor, aceste limitări sunt legate de faptul că baza de date folosită pentru pregătirea sistemului provine doar din clipurile video educative de pe YouTube şi nu este reprezentativă la nivelul întregii populaţii umane. (AGERPRES)

Premieră în UE: Autorizarea unui medicament pentru Alzheimer precoce
Ştiinţă & Tehnologie 17 Aprilie 2025, 13:16

Premieră în UE: Autorizarea unui medicament pentru Alzheimer precoce

Este un medicament pentru deficienţe cognitive uşoare, în stadiile incipiente ale bolii Alzheimer, dar tratamentul se face în...

Premieră în UE: Autorizarea unui medicament pentru Alzheimer precoce
Şase femei au zburat până la marginea spațiului
Ştiinţă & Tehnologie 14 Aprilie 2025, 19:31

Şase femei au zburat până la marginea spațiului

Vehiculul Blue Origin este complet automatizat, deci nu a existat un pilot la bord.

Şase femei au zburat până la marginea spațiului
Probă de Drum – Opel Grandland MHEV
Ştiinţă & Tehnologie 14 Aprilie 2025, 10:14

Probă de Drum – Opel Grandland MHEV

Noua generație a SUV-ului Grandland propusă de constructorul german Opel, este construită pe platforma nouă preluată din...

Probă de Drum – Opel Grandland MHEV
Probă de drum: Renault 5 e-Tech electric
Ştiinţă & Tehnologie 13 Aprilie 2025, 11:54

Probă de drum: Renault 5 e-Tech electric

Deși turbulențele continuă pe piața automobilelor electrificate, unde Tesla a înregistrat scăderi semnificative, grupul...

Probă de drum: Renault 5 e-Tech electric
Summit-ul Inovației Digitale
Ştiinţă & Tehnologie 08 Aprilie 2025, 14:45

Summit-ul Inovației Digitale

Patru zile de conferințe, forumuri și planuri ambițioase pentru transformarea digitală a României.

Summit-ul Inovației Digitale
Auto. Allview intră pe piaţa mobilităţii electrice
Ştiinţă & Tehnologie 08 Aprilie 2025, 14:01

Auto. Allview intră pe piaţa mobilităţii electrice

Compania românească a prezentat pe piaţa autohtonă primele vehicule electrice utilitare

Auto. Allview intră pe piaţa mobilităţii electrice
O specie de lup dispărută în urmă cu 12.500 de ani a fost readusă la viaţă
Ştiinţă & Tehnologie 08 Aprilie 2025, 11:27

O specie de lup dispărută în urmă cu 12.500 de ani a fost readusă la viaţă

O companie americană de biotehnologie a obţinut trei pui de lupi preistorici, care erau mai mari decât descendenţii lor moderni.

O specie de lup dispărută în urmă cu 12.500 de ani a fost readusă la viaţă
Probă de Drum – Citroen C4 MHEV
Ştiinţă & Tehnologie 04 Aprilie 2025, 23:08

Probă de Drum – Citroen C4 MHEV

Am scos la plimbare Hatchbackul C4 al celor de la Citroen propus de această dată în interesanta motorizare mild-hybrid care...

Probă de Drum – Citroen C4 MHEV