İstənilən şəxsin səsini yamsılayan neyron şəbəkə

11:31 11-01-2023 | icon 469 | Maraqlı
İstənilən şəxsin səsini yamsılayan neyron şəbəkə

“Microsoft” cəmi üç saniyəlik nümunə əsasında istənilən şəxsin səsini təqlid edə bilən VALL-E adlı mətni nitqə çevirən neyron şəbəkəsini yaradıb.

 

Digər insanların səslərinin müxtəlif vəziyyətlərdə necə səsləndiyini bilən neyroşəbəkə eyni situasiyalarda “donorun” nitqinin necə səslənəcəyini təxmin edir. Beləliklə, VALL-E təbii intonasiyalarla nümunə daşıyıcısının səsini çox real şəkildə təqlid edə bilir.

 

VALL-E-nin yaradılması zamanı EnCodec audio sıxılma texnologiyası və ümumi müddəti təxminən 60 min saat olan 7 mindən çox insanın səs yazıları kitabxanasından istifadə edilib. Hər iki məhsul “Meta” korporasiyasına məxsusdur.

 

“Microsoft” şirkəti hesab edir ki, yeni neyron şəbəkə mətn əsasında audio məzmunun yaradılması zamanı faydalı olacaq. Xüsusilə, VALL-E tamamilə orijinal məzmun yaratmaq üçün GPT-3 mətn generatoru ilə birlikdə istifadə edilə bilər.

Xəbər lenti

InvestAZ

Ən çox oxunan xəbərlər

Laçın şəhərinə getmək istəyənlərə ŞAD XƏBƏR

“Aksiyalarla, hədələrlə nəyə nail olmağa çalışırlar?”

Şəhidlik zirvəsinə yüksəlmənin 30-cu ili

Azərbaycan-Rusiya əlaqələri dünəndən bu günə…

ABŞ-ın ermənilərə dəstək siyasətinin TƏZAHÜRÜ

Kirəcləşmə, duzlaşma oynaq xəstəliyi - osteoartrit

Adı Azərbaycan kino tarixində əbədi yaşayacaq...

İqtisadi tarazlıq nə zaman pozulur?

Milli Azərbaycan Tarixi Muzeyinin yeni ekspozisiyasının TƏQDİMATI

İlham Əliyevdən quru sərhədləri ilə bağlı önəmli AÇIQLAMA

İsmayıl Osmanlı - 122

İctimai nəqliyyatla bağlı XOŞ XƏBƏR

Tarixi dostluq və mehriban qonşuluq

Parlament seçkiləri bu tarixdə keçiriləcək

Beyləqanda DƏHŞƏTLİ CİNAYƏT