Ascultă Radio România Actualitaţi Live

Sistem AI capabil să genereze chipurile oamenilor după ce le ascultă vocea

Cercetătorii de la MIT au conceput un sistem de inteligenţă artificială capabil să genereze o imagine digitală a unei persoane doar în funcţie de vocea acesteia.

Foto: maxpixel.net.

Articol de Răzvan Stancu, 16 Iunie 2019, 12:58

Cercetători americani de la MIT CSAIL (Computer Science & Artificial Intelligence Laboratory) au conceput un sistem de inteligenţă artificială (AI) capabil să genereze o imagine digitală a unei persoane doar în funcţie de vocea acesteia, ascultând o scurtă înregistrare audio cu respectiva persoană, informează LiveScience care citează un studiu publicat la sfârşitul lunii trecute în jurnalul arXiv şi nu au fost încă evaluate în sistemul peer-review.

Denumit Speech2Face, acest sistem este o reţea neuronală - un computer care gândeşte într-un mod similar cu un creier uman - şi a fost 'antrenat' de oamenii de ştiinţă folosind milioane de clipuri video educaţionale de pe internet în care vorbesc peste 100.000 de oameni diferiţi.

Pornind de la această bază de date, Speech2Face a învăţat să facă asociaţii între timbrul vocii şi anumite trăsături ale feţei. Apoi sistemul AI a fost folosit pentru a genera faţa care corespunde unei anumite înregistrări audio.

Deocamdată sistemul AI nu ştie cu exactitate cum arată un individ pornind doar de la sunetul vocii acestuia, însă reţeaua neuronală recunoaşte anumite caracteristici ale vocii care definesc în principal genul, vârsta şi etnia, elemente generale pentru mari categorii de oameni, conform autorilor sistemului.

'Astfel, acest model va produce chipuri care arată generic. El nu va produce imagini ale anumitor indivizi', notează oamenii de ştiinţă.

Chipurile generate de Speech2Face privesc drept înainte şi au expresii neutre. Ele nu corespund exact persoanelor ale căror voci au fost analizate în cadrul studiului. Cu toate acestea, sistemul identifică de obicei în mod curent categoria de vârstă a subiectului a cărui voce a analizat-o, etnia şi genul său.

Confruntat cu variaţii de limbă, sistemul AI a fost însă uşor de păcălit. Spre exemplu, când a ascultat o persoană asiatică vorbind în chineză, sistemul a generat figura unui asiatic. Însă atunci când aceeaşi persoană a vorbit în engleză, sistemul a fost păcălit şi a generat imaginea unei persoane caucaziene.

De asemenea, sistemul şi-a demonstrat limitele şi în ceea ce priveşte interpretarea genului persoanei în funcţie de tonalităţile vocii. Astfel, AI-ul a asociat vocile mai groase, mai grave, cu subiecţi de sex masculin şi vocile mai subţiri, cu tonalităţi mai ridicate cu subiecţi de genul feminin, asociere care nu este de fiecare dată corectă.

Conform cercetătorilor, aceste limitări sunt legate de faptul că baza de date folosită pentru pregătirea sistemului provine doar din clipurile video educative de pe YouTube şi nu este reprezentativă la nivelul întregii populaţii umane. (AGERPRES)

Summit dedicat inovării digitale
Ştiinţă & Tehnologie 16 Aprilie 2024, 18:32

Summit dedicat inovării digitale

Institutul Naţional de Cercetare-Dezvoltare în Informatică organizează, la Palatul Parlamentului, un summit dedicat inovării...

Summit dedicat inovării digitale
„Eco-insule” pentru colectarea selectivă a gunoiului
Ştiinţă & Tehnologie 13 Aprilie 2024, 13:54

„Eco-insule” pentru colectarea selectivă a gunoiului

Green Energy Expo & Romenvirotec, târgul pentru energii regenerabile şi protecţia mediului, s-a deschis la București.

„Eco-insule” pentru colectarea selectivă a gunoiului
Proba de Drum cu Honda ZR-V
Ştiinţă & Tehnologie 07 Aprilie 2024, 06:45

Proba de Drum cu Honda ZR-V

Când vine vorba de mașini, tendința la nivel global este de reducere a poluării generate de motorizările clasice, cu ardere...

Proba de Drum cu Honda ZR-V
Ghid pentru identificarea Deepfake
Ştiinţă & Tehnologie 01 Aprilie 2024, 18:54

Ghid pentru identificarea Deepfake

Ghidul are ca obiectiv principal protejarea şi educarea publicului cu privire la conştientizarea riscurilor de securitate...

Ghid pentru identificarea Deepfake
Bucureștiul, „hub al tehnologiei pentru marile companii”
Ştiinţă & Tehnologie 21 Martie 2024, 10:23

Bucureștiul, „hub al tehnologiei pentru marile companii”

Prysmian a inaugurat în Capitală Centrul de Excelența în IT în prezența Excelenței Sale, Ambasadorul Italiei în România,...

Bucureștiul, „hub al tehnologiei pentru marile companii”
Atacuri cibernetice îndreptate împotriva unor bănci și unor instituții publice
Ştiinţă & Tehnologie 16 Martie 2024, 13:46

Atacuri cibernetice îndreptate împotriva unor bănci și unor instituții publice

Directoratul Național pentru Securitate Cibernetică semnalează că în ultimele două zile s-au înregistrat mai multe atacuri...

Atacuri cibernetice îndreptate împotriva unor bănci și unor instituții publice
Sute de site-uri de internet folosesc în prezent inteligenţa artificială pentru a crea articole fără intervenţie umană
Ştiinţă & Tehnologie 12 Martie 2024, 10:24

Sute de site-uri de internet folosesc în prezent inteligenţa artificială pentru a crea articole fără intervenţie umană

O instituţie specializată în acest domeniu a identificat până acum 739 de site-uri care funcţionează fără sau cu foarte...

Sute de site-uri de internet folosesc în prezent inteligenţa artificială pentru a crea articole fără intervenţie umană
Numeroși utilizatori nu pot accesa Facebook
Ştiinţă & Tehnologie 05 Martie 2024, 17:56

Numeroși utilizatori nu pot accesa Facebook

UPDATE: Funcționarea Facebook a revenit la normal.

Numeroși utilizatori nu pot accesa Facebook