«OpenAI» mətni real videolara çevirmək üçün «Sora AI» proqramını təqdim etdi

«OpenAI» mətni real videolara çevirmək üçün «Sora AI» proqramını təqdim etdi

OpenAI video yaratmaq üçün Sora adlı yeni neyron şəbəkəsini təqdim etdi. Şirkət bildirir ki, Sora «mətn təlimatlarından istifadə edərək real və fantastik səhnələr yarada bilər». Mətni videoya çevirmə modeli istifadəçilərə mətn təsvirlərinə əsaslanaraq Full HD təsvir ölçüsündə (1920 × 1080 piksel) bir dəqiqəyə qədər fotorealistik videolar yaratmağa imkan verir.
OpenAI bloq yazısında bildirib ki, Sora «çox personajlar, xüsusi hərəkət növləri və dəqiq obyekt və fon detalları ilə mürəkkəb səhnələr» yaratmağa qadirdir. Şirkət həmçinin qeyd edir ki, neyron şəbəkə obyektlərin “fiziki dünyada necə mövcud olduğunu” başa düşə, həmçinin “rekvizitləri dəqiq şərh edə və güclü emosiyaları ifadə edən cəlbedici personajlar yarada bilər”.
Model hərəkətsiz təsvirdən video yarada, mövcud videoda çatışmayan kadrları doldura və ya onu genişləndirə bilər. Sora ilə yaradılmış və OpenAI bloqunda nümayiş etdirilən demolara California Gold Rush səhnəsi, Tokio qatarının içindən görünən video və s. daxildir. Onların bir çoxunda süni intellektin işini göstərən bəzi artefaktlar var. Məsələn, muzeylə bağlı videodakı şübhəli şəkildə hərəkət edən mərtəbə. OpenAI özü deyir ki, model «mürəkkəb səhnənin fizikasını dəqiq simulyasiya etməkdə çətinlik çəkə bilər», lakin ümumilikdə nəticələr olduqca təsir edicidir.
Bir neçə il əvvəl süni intellektin sözləri şəkillərə çevirmək qabiliyyətini ən yaxşı nümayiş etdirən Midjourney kimi mətndən-şəklə generatorları idi. Lakin generativ video son vaxtlar diqqətəlayiq sürətlə inkişaf edir, Runway və Pika kimi şirkətlər təsirli mətndən videoya çevirmə modellərini nümayiş etdirir və Google-un Lumiere bu sahədə OpenAI-nin əsas rəqiblərindən birinə çevrilir. Sora kimi, Lumiere də istifadəçilərə mətni videoya çevirmək üçün alətlər təqdim edir və həmçinin istifadəçilərə hərəkətsiz şəkildən videolar yaratmağa imkan verir.
Hazırda Sora yalnız modeli potensial zərərlər və risklər üçün qiymətləndirən fərdi sınaqçılar üçün əlçatandır. OpenAI həmçinin rəy almaq üçün fərdi rəssamlara, dizaynerlərə və kinorejissorlara tələb əsasında çıxış təklif edir. Şirkət qeyd edir ki, mövcud model mürəkkəb səhnənin fizikasını dəqiq şəkildə simulyasiya etməyə bilər və səbəb-nəticə əlaqələrinin bəzi nümunələrini yanlış şərh edə bilər.
Bu ayın əvvəlində OpenAI, mətndən şəkilə alət DALL-E 3-ə işarələr əlavə etdiyini açıqladı, lakin onların asanlıqla silinə biləcəyini qeyd etdi. Digər süni intellekt məhsullarında olduğu kimi, OpenAI də süni intellektlə yaradılmış saxta fotoreal videoların real olaraq ötürülməsinin nəticələri ilə mübarizə aparmalı olacaq.