Ascultă Radio România Actualitaţi Live

Sistem AI capabil să genereze chipurile oamenilor după ce le ascultă vocea

Cercetătorii de la MIT au conceput un sistem de inteligenţă artificială capabil să genereze o imagine digitală a unei persoane doar în funcţie de vocea acesteia.

Foto: maxpixel.net.

Articol de Răzvan Stancu, 16 Iunie 2019, 12:58

Cercetători americani de la MIT CSAIL (Computer Science & Artificial Intelligence Laboratory) au conceput un sistem de inteligenţă artificială (AI) capabil să genereze o imagine digitală a unei persoane doar în funcţie de vocea acesteia, ascultând o scurtă înregistrare audio cu respectiva persoană, informează LiveScience care citează un studiu publicat la sfârşitul lunii trecute în jurnalul arXiv şi nu au fost încă evaluate în sistemul peer-review.

Denumit Speech2Face, acest sistem este o reţea neuronală - un computer care gândeşte într-un mod similar cu un creier uman - şi a fost 'antrenat' de oamenii de ştiinţă folosind milioane de clipuri video educaţionale de pe internet în care vorbesc peste 100.000 de oameni diferiţi.

Pornind de la această bază de date, Speech2Face a învăţat să facă asociaţii între timbrul vocii şi anumite trăsături ale feţei. Apoi sistemul AI a fost folosit pentru a genera faţa care corespunde unei anumite înregistrări audio.

Deocamdată sistemul AI nu ştie cu exactitate cum arată un individ pornind doar de la sunetul vocii acestuia, însă reţeaua neuronală recunoaşte anumite caracteristici ale vocii care definesc în principal genul, vârsta şi etnia, elemente generale pentru mari categorii de oameni, conform autorilor sistemului.

'Astfel, acest model va produce chipuri care arată generic. El nu va produce imagini ale anumitor indivizi', notează oamenii de ştiinţă.

Chipurile generate de Speech2Face privesc drept înainte şi au expresii neutre. Ele nu corespund exact persoanelor ale căror voci au fost analizate în cadrul studiului. Cu toate acestea, sistemul identifică de obicei în mod curent categoria de vârstă a subiectului a cărui voce a analizat-o, etnia şi genul său.

Confruntat cu variaţii de limbă, sistemul AI a fost însă uşor de păcălit. Spre exemplu, când a ascultat o persoană asiatică vorbind în chineză, sistemul a generat figura unui asiatic. Însă atunci când aceeaşi persoană a vorbit în engleză, sistemul a fost păcălit şi a generat imaginea unei persoane caucaziene.

De asemenea, sistemul şi-a demonstrat limitele şi în ceea ce priveşte interpretarea genului persoanei în funcţie de tonalităţile vocii. Astfel, AI-ul a asociat vocile mai groase, mai grave, cu subiecţi de sex masculin şi vocile mai subţiri, cu tonalităţi mai ridicate cu subiecţi de genul feminin, asociere care nu este de fiecare dată corectă.

Conform cercetătorilor, aceste limitări sunt legate de faptul că baza de date folosită pentru pregătirea sistemului provine doar din clipurile video educative de pe YouTube şi nu este reprezentativă la nivelul întregii populaţii umane. (AGERPRES)

Probă de drum: Dacia Bigster full-hybrid 155
Ştiinţă & Tehnologie 25 Octombrie 2025, 20:23

Probă de drum: Dacia Bigster full-hybrid 155

Dacia a primit o nouă confirmare după primele nouă luni din acest an. Bigster s-a dovedit al doilea cel mai vândut SUV de...

Probă de drum: Dacia Bigster full-hybrid 155
Universitatea Ovidius din Constanţa produce energie verde pentru propriul consum
Ştiinţă & Tehnologie 24 Octombrie 2025, 12:30

Universitatea Ovidius din Constanţa produce energie verde pentru propriul consum

Universitatea Ovidius din Constanţa a devenit prosumator, producând energie verde prin 1.100 de panouri fotovoltaice care...

Universitatea Ovidius din Constanţa produce energie verde pentru propriul consum
Tații „tind să fie mai familiarizați” cu funcțiile de control parental
Ştiinţă & Tehnologie 22 Octombrie 2025, 17:28

Tații „tind să fie mai familiarizați” cu funcțiile de control parental

Studiu realizat de o asociație pentru protecția minorilor, în colaborare cu TikTok, privind controlul parental al mediului...

Tații „tind să fie mai familiarizați” cu funcțiile de control parental
Republica Moldova și Ucraina vor fi incluse în zona tarifelor europene de roaming
Ştiinţă & Tehnologie 20 Octombrie 2025, 17:07

Republica Moldova și Ucraina vor fi incluse în zona tarifelor europene de roaming

Tarifele vor intra în vigoare de la 1 ianuarie 2026.

Republica Moldova și Ucraina vor fi incluse în zona tarifelor europene de roaming
Hemoglobinuria Paroxistică Nocturnă - o boală rară, gravă și frecvent subdiagnosticată
Ştiinţă & Tehnologie 14 Octombrie 2025, 10:33

Hemoglobinuria Paroxistică Nocturnă - o boală rară, gravă și frecvent subdiagnosticată

Medicii atrag atenţia că oboseala severă şi persistentă, anemia, durerile abdominale şi urina închisă la culoare pot fi...

Hemoglobinuria Paroxistică Nocturnă - o boală rară, gravă și frecvent subdiagnosticată
Auto: Dacia aduce noutăți pentru electricul Spring la Paris
Ştiinţă & Tehnologie 09 Octombrie 2025, 09:02

Auto: Dacia aduce noutăți pentru electricul Spring la Paris

Dacia își îndeplinește toate promisiunile făcute pentru Spring, primul său model complet electric. De la lansarea sa în 2021,...

Auto: Dacia aduce noutăți pentru electricul Spring la Paris
Salonul Auto București. BYD a lansat 2 modele PHEV în premieră națională
Ştiinţă & Tehnologie 08 Octombrie 2025, 19:50

Salonul Auto București. BYD a lansat 2 modele PHEV în premieră națională

Cel mai mare producător mondial de autovehicule cu energie nouă a prezentat SEAL 5 DM-i și SEAL 6 DM-i, două vehicule plug-in...

Salonul Auto București. BYD a lansat 2 modele PHEV în premieră națională
Auto: a început Salonul Auto București și Accesorii la Romexpo
Ştiinţă & Tehnologie 07 Octombrie 2025, 14:43

Auto: a început Salonul Auto București și Accesorii la Romexpo

Am avut deschiderea oficială și primele conferințe de presă la Salonul Auto București și Accesorii, un eveniment ce se...

Auto: a început Salonul Auto București și Accesorii la Romexpo

Radio România

România revine la Eurovision

România revine la Eurovision

România revine la Eurovision
Mihai Gruia Sandu: "Fiecare rol are o muzică interioară" | VIDEO

Mihai Gruia Sandu: "Fiecare rol are o muzică interioară" | VIDEO

Mihai Gruia Sandu: "Fiecare rol are o muzică interioară" | VIDEO
BOTOȘANI: Autoritățile au pregătit peste 11.000 de locuri de cazare pentru posibile situaţii de urgenţă în sezonul rece

BOTOȘANI: Autoritățile au pregătit peste 11.000 de locuri de cazare pentru posibile situaţii de urgenţă în sezonul rece

BOTOȘANI: Autoritățile au pregătit peste 11.000 de locuri de cazare pentru posibile situaţii de urgenţă în sezonul rece
GALAȚI: Expoziția florală „Regina Toamnei, Crizantema”, la Grădina Botanică

GALAȚI: Expoziția florală „Regina Toamnei, Crizantema”, la Grădina Botanică

GALAȚI: Expoziția florală „Regina Toamnei, Crizantema”, la Grădina Botanică