«Meta» mətni bir dildən başqa dilə tərcümə edən süni intellekt istifadəyə verir

«Meta» mətni bir dildən başqa dilə tərcümə edən süni intellekt istifadəyə verir

Meta 101 dildən tərcümə edə bilən SeamlessM4T adlı süni intellekt modelini buraxdı. Layihə danışıq dilini danışılan kimi emal edə bilən universal real vaxt tərcüməçisinin yaradılması istiqamətində bir addımdır.
Tərcümə üçün ənənəvi süni intellekt modelləri çoxmərhələli prosesdə işləyir: əvvəlcə danışıq dili mətnə ​​çevrilir, sonra həmin mətn başqa dilə tərcümə edilir, sonra isə yeni dildəki mətn yenidən danışıq dilinə çevrilir. Bu üsul həmişə kifayət qədər təsirli deyil, çünki hər mərhələdə səhv tərcümə nəticəsi ilə nəticələnə biləcək səhvlərin olma ehtimalı var. Yeni Meta SeamlessM4T modeli birbaşa tərcümə edir və tərtibatçıların fikrincə, ən yaxşı müasir modellərdən 23% daha dəqiqdir. Google-un arsenalına 113 dili dəstəkləyən, lakin yalnız ingilis dilinə tərcümə edən AudioPaLM modeli daxildir; SeamlessM4T 101 dildən 36 dilə tərcümə edir.
Layihənin uğurunun açarı paralel məlumatların toplanması prosesi idi: süni intellekt veb mənbələrin skan edilmiş məlumatlarında audio və ya videonun başqa dildə altyazılarla uyğunlaşdığı halları qeyd edir. Nəticədə model bir dildə olan bu səsləri digər dildə mətnin müvafiq fraqmentləri ilə əlaqələndirməyi öyrəndi. Layihənin müəllifləri isə etiraf edirlər ki, tərcümədə insanın iştirakı vacib olaraq qalır: insan mədəni konteksti nəzərə almaq və ifadənin mənasının bir dildən digər dilə ötürülməsini təmin etmək iqtidarındadır. Tibbdə və ya hüquqda maşın tərcüməsi insan tərəfindən diqqətlə yoxlanılmalıdır, əks halda anlaşılmazlıqlar yarana bilər.
Süni intellekt modellərinin müxtəlif dillər üçün müxtəlif həcmdə təlim məlumatlarına malik ola biləcəyini də nəzərə almaq lazımdır: çoxlu yunan-ingilis tərcümə nümunələri ola bilər, lakin suahili-yunanca tərcümə məlumatları yoxdur. Bu problemi həll etmək üçün SeamlessM4T tərtibatçıları modeli müxtəlif dillərdə söhbətlərin milyonlarla saatlıq audioyazıları üzərində əvvəlcədən öyrədiblər. Bu təlim süni intellektə dillər arasında ümumi nümunələri tanımağa kömək etdi, daha az ümumi dilləri emal etməyi asanlaşdırdı, çünki model artıq danışıq dillərinin necə səslənəcəyinə dair əsas biliyə malik idi.
Sistem açıq mənbə kimi mövcuddur və tərtibatçılar ümid edirlər ki, başqalarını cari imkanları üzərində qurmağa təşviq edəcəklər. Bəzi ekspertlər hələ də SeamlessM4T-nin praktikada nə qədər faydalı ola biləcəyinə şübhə ilə yanaşırlar və Google-un qapalı modelinin əhəmiyyətli dərəcədə daha sürətli işlədiyini qeyd edirlər. Meta iddia edir ki, şirkətin mütəxəssisləri artıq insan tərcüməçiləri qədər sürətli olan Seamless-in daha yeni versiyasını yaradıblar.