Neyroşəbəkə üç saniyəlik məşqdən sonra insan səsini təqlid etməyi öyrənib

Neyroşəbəkə üç saniyəlik məşqdən sonra insan səsini təqlid etməyi öyrənib

“Microsoft” üç saniyəlik nümunəni dinləməklə istənilən insanın səsini təqlid edə bilən süni intellektə əsaslanan alqoritm olan VALL-E-ni təqdim etdi.Onun mənbə kodu hələ sərbəst şəkildə mövcud deyil,lakin şirkət artıq sintez edilmiş nitqin keyfiyyətini qiymətləndirmək üçün istifadə edilə bilən süni intellekt işinin onlarla nümunəsini paylaşıb.
Alqoritm səs və mətndən nümunə götürür və nəticədə mətnin səslənməsini yaradır.Nümunəyə əsaslanan səsli surət çıxarma vasitələri onlayn mövcuddur, lakin oxşar nümunələr yaratmağa başlamaq üçün adətən bir neçə dəqiqə mənbə materialı alır. VALL-E-nin unikallığı ondan ibarətdir ki, alqoritmin nitqə çevrilməsi üçün yalnız üç saniyəlik səs və mətn nümunəsi lazımdır. Tərtibatçıların fikrincə, proqram hətta nümunədə olmayan natiqin emosiyalarını və tonunu da təqlid edə bilir.VALL-E 60.000 saat danışıq ingiliscəsinə öyrədilmiş neyron şəbəkəsinə əsaslanır. Microsoft alqoritmin ictimai domendə görünüb-göstərməyəcəyini dəqiqləşdirmir. Siz Cornell Universitetinin araşdırmasında süni intellekt mexanizmi haqqında daha çox məlumat əldə edə bilərsiniz və səsvermə nümunələri GitHub-da mövcuddur. Bundan əvvəl Microsoft şirkəti Skype üçün həmsöhbətin səsini real vaxtda təqlid edə bilən tərcüməçi təqdim edib.