Ascultă Radio România Actualitaţi Live

Sistem AI capabil să genereze chipurile oamenilor după ce le ascultă vocea

Cercetătorii de la MIT au conceput un sistem de inteligenţă artificială capabil să genereze o imagine digitală a unei persoane doar în funcţie de vocea acesteia.

Foto: maxpixel.net.

Articol de Răzvan Stancu, 16 Iunie 2019, 12:58

Cercetători americani de la MIT CSAIL (Computer Science & Artificial Intelligence Laboratory) au conceput un sistem de inteligenţă artificială (AI) capabil să genereze o imagine digitală a unei persoane doar în funcţie de vocea acesteia, ascultând o scurtă înregistrare audio cu respectiva persoană, informează LiveScience care citează un studiu publicat la sfârşitul lunii trecute în jurnalul arXiv şi nu au fost încă evaluate în sistemul peer-review.

Denumit Speech2Face, acest sistem este o reţea neuronală - un computer care gândeşte într-un mod similar cu un creier uman - şi a fost 'antrenat' de oamenii de ştiinţă folosind milioane de clipuri video educaţionale de pe internet în care vorbesc peste 100.000 de oameni diferiţi.

Pornind de la această bază de date, Speech2Face a învăţat să facă asociaţii între timbrul vocii şi anumite trăsături ale feţei. Apoi sistemul AI a fost folosit pentru a genera faţa care corespunde unei anumite înregistrări audio.

Deocamdată sistemul AI nu ştie cu exactitate cum arată un individ pornind doar de la sunetul vocii acestuia, însă reţeaua neuronală recunoaşte anumite caracteristici ale vocii care definesc în principal genul, vârsta şi etnia, elemente generale pentru mari categorii de oameni, conform autorilor sistemului.

'Astfel, acest model va produce chipuri care arată generic. El nu va produce imagini ale anumitor indivizi', notează oamenii de ştiinţă.

Chipurile generate de Speech2Face privesc drept înainte şi au expresii neutre. Ele nu corespund exact persoanelor ale căror voci au fost analizate în cadrul studiului. Cu toate acestea, sistemul identifică de obicei în mod curent categoria de vârstă a subiectului a cărui voce a analizat-o, etnia şi genul său.

Confruntat cu variaţii de limbă, sistemul AI a fost însă uşor de păcălit. Spre exemplu, când a ascultat o persoană asiatică vorbind în chineză, sistemul a generat figura unui asiatic. Însă atunci când aceeaşi persoană a vorbit în engleză, sistemul a fost păcălit şi a generat imaginea unei persoane caucaziene.

De asemenea, sistemul şi-a demonstrat limitele şi în ceea ce priveşte interpretarea genului persoanei în funcţie de tonalităţile vocii. Astfel, AI-ul a asociat vocile mai groase, mai grave, cu subiecţi de sex masculin şi vocile mai subţiri, cu tonalităţi mai ridicate cu subiecţi de genul feminin, asociere care nu este de fiecare dată corectă.

Conform cercetătorilor, aceste limitări sunt legate de faptul că baza de date folosită pentru pregătirea sistemului provine doar din clipurile video educative de pe YouTube şi nu este reprezentativă la nivelul întregii populaţii umane. (AGERPRES)

Auto: Producătorul auto chinez Chery intră în România
Ştiinţă & Tehnologie 12 Iulie 2025, 23:11

Auto: Producătorul auto chinez Chery intră în România

Unul din cei mai mari exportatori de autoturisme din China pentru al 22-lea an consecutiv, producătorul Chery, a ajuns și în...

Auto: Producătorul auto chinez Chery intră în România
Auto: Tracțiune integrală pe E-Transit și versiune hybridă pentru Fiat 500
Ştiinţă & Tehnologie 11 Iulie 2025, 10:41

Auto: Tracțiune integrală pe E-Transit și versiune hybridă pentru Fiat 500

Constructorul american Ford a introdus tracțiunea integrală pe modelul E-Transit Custom pentru a crește productivitatea...

Auto: Tracțiune integrală pe E-Transit și versiune hybridă pentru Fiat 500
Probă de Drum cu Audi Q5
Ştiinţă & Tehnologie 06 Iulie 2025, 20:33

Probă de Drum cu Audi Q5

Noul Audi Q5 este o evoluție subtilă, dar binevenită, a unuia dintre cele mai populare SUV-uri premium din lume. A treia...

Probă de Drum cu Audi Q5
Proba de drum cu Mazda CX-80
Ştiinţă & Tehnologie 29 Iunie 2025, 17:39

Proba de drum cu Mazda CX-80

O prezență care nu poate fi ignorată în ultimul timp pe drumurile din România este noul SUV Mazda CX-80, cel mai recent pariu...

Proba de drum cu Mazda CX-80
Jumătate din Europa se află sub efectele secetei
Ştiinţă & Tehnologie 26 Iunie 2025, 11:32

Jumătate din Europa se află sub efectele secetei

Fenomenul este neobișnuit pentru această dată a anului, arată datele Observatorului European în domeniu.

Jumătate din Europa se află sub efectele secetei
Conturile online inactive, „magneți pentru hackeri”
Ştiinţă & Tehnologie 08 Iunie 2025, 13:49

Conturile online inactive, „magneți pentru hackeri”

Specialiștii ne recomandă să recugem periodic la așa-numite curăţenii digitale.

Conturile online inactive, „magneți pentru hackeri”
DNSC:Tentativă de fraudă propagată pe o pagina de Facebook cu milioane de urmăritori
Ştiinţă & Tehnologie 06 Iunie 2025, 08:01

DNSC:Tentativă de fraudă propagată pe o pagina de Facebook cu milioane de urmăritori

Pentru mai multă credibilitate, atacatorii folosesc o pagină de Facebook cu milioane de urmăritori și bifă de verificare, dar...

DNSC:Tentativă de fraudă propagată pe o pagina de Facebook cu milioane de urmăritori
Fetiță de 14 ani, beneficiară a unui nou transplant de cord efectuat la Târgu Mureș
Ştiinţă & Tehnologie 02 Iunie 2025, 13:39

Fetiță de 14 ani, beneficiară a unui nou transplant de cord efectuat la Târgu Mureș

O fetiță de 14 ani din Teleorman este beneficiara celui de-al treilea transplant de cord efectuat la IUBCvT.

Fetiță de 14 ani, beneficiară a unui nou transplant de cord efectuat la Târgu Mureș