İstənilən şəxsin səsini yamsılayan neyron şəbəkə

11:31 11-01-2023 | icon 234 | Maraqlı
İstənilən şəxsin səsini yamsılayan neyron şəbəkə

“Microsoft” cəmi üç saniyəlik nümunə əsasında istənilən şəxsin səsini təqlid edə bilən VALL-E adlı mətni nitqə çevirən neyron şəbəkəsini yaradıb.

 

Digər insanların səslərinin müxtəlif vəziyyətlərdə necə səsləndiyini bilən neyroşəbəkə eyni situasiyalarda “donorun” nitqinin necə səslənəcəyini təxmin edir. Beləliklə, VALL-E təbii intonasiyalarla nümunə daşıyıcısının səsini çox real şəkildə təqlid edə bilir.

 

VALL-E-nin yaradılması zamanı EnCodec audio sıxılma texnologiyası və ümumi müddəti təxminən 60 min saat olan 7 mindən çox insanın səs yazıları kitabxanasından istifadə edilib. Hər iki məhsul “Meta” korporasiyasına məxsusdur.

 

“Microsoft” şirkəti hesab edir ki, yeni neyron şəbəkə mətn əsasında audio məzmunun yaradılması zamanı faydalı olacaq. Xüsusilə, VALL-E tamamilə orijinal məzmun yaratmaq üçün GPT-3 mətn generatoru ilə birlikdə istifadə edilə bilər.

Xəbər lenti

InvestAZ

Ən çox oxunan xəbərlər

Dövlət-vərtəndaş münasibətləri ZƏDƏLƏNİR

Deputatın SAXTA SEÇKİ ETİRAFI

Partiyaların 5000 üzv həyacanı - VİDEO

Deputat qurumları tənqid etdi

UNEC-də imtahan sessiyaları ləğv oluna bilər

Əhaliyə qriplə bağlı ÇAĞIRIŞ

Qarabağ xanı Mehdiqulu xana məxsus bayrağın sapı bərpadan sonra

Aygünün beş obrazı

“Azərbaycan rəsmi İrandan dəqiq, aydın, məntiqli izahat tələb edir”

 Siyasilər aksiyaya qatılmalıdırlarmı?

Heydər Əliyevin 100 illiyi ilə bağlı əfv sərəncamı İMZALANACAQ

Qarabağ xanına məxsus bayraq bərpa olunub

Azərbaycana gələn əcnəbilərin viza alması üçün PORTAL

Daşaltı əməliyyatının 31-ci ili

Məhkəmədə etiraf