«Apple» mətn əmrlərindən istifadə edərək fotoşəkillərin redaktəsi üçün süni intellekt təqdim etdi

«Apple» mətn əmrlərindən istifadə edərək fotoşəkillərin redaktəsi üçün süni intellekt təqdim etdi

Apple-ın tədqiqat bölməsi Santa Barbara Kaliforniya Universitetinin tədqiqatçıları ilə birlikdə şəkillərin redaktə edilməsi üçün nəzərdə tutulmuş multimodal süni intellekt modeli olan MGIE-ni buraxıb. Snapshotda dəyişiklik etmək üçün istifadəçi yalnız çıxış kimi əldə etmək istədiyini təbii dildə təsvir etməlidir.
MGIE (Multimodal Large Language Model-Guided Image Redaktə) təsvirin redaktəsi ilə bağlı müxtəlif mürəkkəblikdə olan tapşırıqlar üçün istifadə oluna bilər: siz müxtəlif obyektlər əlavə edə, onları silə və ya dəyişdirə bilərsiniz. Əmr qəbul edərkən model istifadəçinin sözlərini şərh edir və sonra onlara uyğun olaraq dəyişdirildikdə şəklin necə görünəcəyini “təsəvvür edir”.MGIE-ni təsvir edən məqalə onun işindən bir neçə nümunə verir. Modelə redaktə etmək üçün pizzanın şəkli verildikdə və ondan «daha sağlam olması» xahiş edildikdə, o, tərəvəz əlavə etdi. Sonra ona səhrada bir çitanın həddən artıq qaranlıq fotoşəkili təklif edildi və «daha çox işığı simulyasiya edərək kontrast əlavə etməsi» xahiş olundu — görüntü daha parlaq oldu. MGIE GitHub-da pulsuz yükləmək üçün mövcuddur və siz onu Hugging Face Spaces platformasında sınaya bilərsiniz. Apple tədqiqat layihəsi xaricində şirkətin model üçün planlarının nə olduğunu açıqlamayıb.
Şəkillərin redaktəsi OpenAI DALL-E 3 daxil olmaqla bir neçə AI generatoru tərəfindən dəstəklənir; Generativ süni intellekt xüsusiyyətləri Adobe Firefly modeli sayəsində Photoshop-da da mövcuddur. Apple özünü Microsoft, Meta və ya Google kimi süni intellektdə əsas oyunçu kimi göstərmir, lakin CEO Tim Cook bu yaxınlarda istehsalçının bu il cihazlarına yeni AI xüsusiyyətləri əlavə edəcəyini söylədi. Keçən ilin dekabr ayında şirkət Apple Silicon çiplərində süni intellekt modellərini öyrətmək üçün MLX açıq platformasını buraxdı.