«Google»dan möhtəşəm yenilik-mətn əsasında audio və video yaratmağa malik olan süni intellekt...

«Google»dan möhtəşəm yenilik-mətn əsasında audio və video yaratmağa malik olan süni intellekt yaradıldı-VİDEO

Google mətn əsasında audio və video yaratmağa qadir olan AI modeli VideoPoet təqdim etdi. Tərtibatçıların fikrincə, o, digər oxşar həllərdən nəzərəçarpacaq dərəcədə fərqlənir və hətta uzun videolar yaratmağa, həmçinin hazır materialları redaktə etməyə qadirdir.
Google-a görə, digər oxşar açıq mənbəli diffuziya əsaslı neyron şəbəkələrindən fərqli olaraq, onun həlli geniş dil modelinə (LLM) əsaslanır — adətən mətn və kod yaratmaq üçün istifadə olunan növ (məsələn, ChatGPT və ya Llama 2).
Süni intellektə öyrətmək üçün tərtibatçılar İnternetdən və digər mənbələrdən götürülmüş 270 milyon videodan və bir milyarddan çox mətn/şəkil cütlüyündən istifadə ediblər. Google iddia edir ki, onun xüsusi dil modeli ona rəqiblərdən daha uzun, daha keyfiyyətli videolar yaratmağa imkan verir, xüsusən də hərəkət edən obyektlər zamanı minimum artefakt və məhdudiyyətlərlə.

VideoPoet-in arsenalına müxtəlif kamera hərəkətlərinin imitasiyası, müxtəlif vizual üslublar, videonun kontekstinə əsasən orijinal audionun yaradılması, həmçinin Snapchat və TikTok formatında şaquli videolar yaratmaq imkanı daxildir.
Google Research tərəfindən aparılan araşdırma göstərdi ki, respondentlərin 35%-ə qədəri nəsil nəticələrini müqayisə etdikdən sonra digər şirkətlərin həlləri əvəzinə VideoPoet-ə üstünlük verib. AI modelinin kommersiya təqdimatının vaxtı hələ açıqlanmayıb. Neyron şəbəkənin imkanları ilə layihənin rəsmi saytında tanış ola bilərsiniz.