İstənilən şəxsin səsini yamsılayan neyron şəbəkə

11:31 11-01-2023 | icon 470 | Maraqlı
İstənilən şəxsin səsini yamsılayan neyron şəbəkə

“Microsoft” cəmi üç saniyəlik nümunə əsasında istənilən şəxsin səsini təqlid edə bilən VALL-E adlı mətni nitqə çevirən neyron şəbəkəsini yaradıb.

 

Digər insanların səslərinin müxtəlif vəziyyətlərdə necə səsləndiyini bilən neyroşəbəkə eyni situasiyalarda “donorun” nitqinin necə səslənəcəyini təxmin edir. Beləliklə, VALL-E təbii intonasiyalarla nümunə daşıyıcısının səsini çox real şəkildə təqlid edə bilir.

 

VALL-E-nin yaradılması zamanı EnCodec audio sıxılma texnologiyası və ümumi müddəti təxminən 60 min saat olan 7 mindən çox insanın səs yazıları kitabxanasından istifadə edilib. Hər iki məhsul “Meta” korporasiyasına məxsusdur.

 

“Microsoft” şirkəti hesab edir ki, yeni neyron şəbəkə mətn əsasında audio məzmunun yaradılması zamanı faydalı olacaq. Xüsusilə, VALL-E tamamilə orijinal məzmun yaratmaq üçün GPT-3 mətn generatoru ilə birlikdə istifadə edilə bilər.

Xəbər lenti

InvestAZ

Ən çox oxunan xəbərlər

Ənvər Sadıqov - 58

Deputatın “Başkənd” iddiası ciddi qınağa səbəb oldu

İltihab xəstəliklərində nələri nəzərə almaq lazımdır?

"Almaniyaya səfər məhsuldar keçdi"

Azərbaycanda 1 May Bayramı keçirilə bilər?

Rektor yubiley medalı ilə təltif edildi

82 minə yaxın uşaq avtomatik olaraq 1-ci sinfə yerləşdirilib

Qarabağ Universitetinin yataqxanası ödənişli olacaq?

“For Azerbaijan”ın qrant müsabiqəsinin NƏTİCƏLƏRİ

Məhkəmədən Anar Məmmədli barədə QƏRAR

Manyak ƏLƏ KEÇDİ

MHB-nin Göyçay rayon təşkilatı təsis olundu

Sakinlərin NƏZƏRİNƏ

VI Ümumdünya Mədəniyyətlərarası Dialoq Forumuna START

Tibbi arayışlar elektron formaya KEÇDİ