«Apple» «M2» çipli qulaqlıqlar eyni anda bir neçə nəfərin danışığını tərcümə edir

«Apple» «M2» çipli qulaqlıqlar eyni anda bir neçə nəfərin danışığını tərcümə edir

Vaşinqton Universitetinin tədqiqatçıları real vaxt rejimində müxtəlif dillərdə danışan bir çox insanın nitqini tərcümə edə bilən süni intellektlə işləyən qulaqlıqlar hazırlayıblar. Sistem Spatial Speech Translation adlanır və insan qulaqlarının səsi qəbul etmə üsulunu simulyasiya edən binaural qulaqlıqlardan istifadə edir.
Yalnız bir audio axını emal edə bilən mövcud həllərdən fərqli olaraq, yeni texnologiya eyni vaxtda bir neçə dinamikin səsini tanıya və tərcümə edə bilər. Bu, insanların müxtəlif dillərdə ünsiyyət qurduğu konfranslar və ya barlar kimi səs-küylü mühitlərdə istifadə üçün imkanlar açır.

Texnologiya Apple M2 prosessorunda real vaxt rejimində işləyən səs mənbəyinin ayrılması, lokalizasiyası, tərcüməsi və binaural göstərilməsinin birləşməsinə əsaslanır. Mikrofonlar nitqin istiqamətini qeyd edir və süni intellekt hər bir səsi ayrıca emal edir, onun lokalizasiyasını və həcmini qoruyur. Prototip buludlara məlumat göndərmədən yerli olaraq işləyir və yerli danışanların nitqinin təbii tembrini qoruyur.
Qulaqlıqlar həm daxili, həm də açıq havada sınaqdan keçirilmişdir. Sistem nitqi 2-4 saniyə gecikmə ilə tərcümə edir, istifadəçilər daha yaxşı qavramaq üçün 3-4 saniyə gecikməyə üstünlük verirlər. Hazırda ispan, alman və fransız dilləri dəstəklənir, lakin tərtibatçılar bu siyahını genişləndirməyi planlaşdırırlar.
Layihə kodu açıq istifadə üçün əlçatandır və tərtibatçılar cəmiyyətinə texnologiyanı təkmilləşdirməyə imkan verir. Apple-ın da AirPods üçün oxşar sistem üzərində işlədiyi şayiələr var.