
Google, çoklu mod (multimodal) girdi ve çıktı desteğine sahip yeni yapay zeka modeli Gemini Omni Flash’ı kullanıcılara sunmaya başladı. Bugüne kadar 50 milyardan fazla görsel üreten Nano Banana modeliyle dikkatleri üzerine çeken teknoloji devi, bu yıl çıtayı daha da yükselterek “videodan başlayarak, herhangi bir girdiden her şeyi yaratabilen” yeni Gemini Omni modelini duyurdu.
Görsel, Ses ve Metin Girdileriyle Video Dönemi
Yeni yapay zeka modeli; görselleri, sesleri, videoları ve metinleri girdi olarak bir araya getirme, bunlardan yüksek kaliteli videolar üretme ve sohbet komutları aracılığıyla bu videoları düzenleme imkanı tanıyor. Gemini Omni ailesinin ilk üyesi olan Flash modelinin ardından Google, gelecekte görseller ve sesler gibi diğer çıktı modlarına yönelik destekleri de sisteme eklemeyi planlıyor.
Google I/O 2026 açılış konuşmasında paylaşılan bilgilere göre, yeni model video düzenleme esnasında karakterlerin, sahne dizilimlerinin ve diğer unsurların tutarlı kalmasını sağlıyor. Kullanıcılar doğal dil komutlarını kullanarak sahneye nesne ekleyip çıkarabiliyor, farklı kamera açıları seçebiliyor ya da bunları tamamen değiştirebiliyor.
Fizik Kurallarına ve Kültürel Bağlama Uygun Üretim
Kullanıcılar, kendi çektikleri gerçek bir videoyu Omni modeline yükleyerek yeni karakterler veya nesneler eklenmesini isteyebiliyor ya da videoya CGI (bilgisayar üretimli imgeleme) efektleri dahil edebiliyor. Google, konuya ilişkin yaptığı açıklamada, “Orijinal sahnenizin akışını hiçbir şekilde kaybetmeden ortamı, açıyı, tarzı ve hatta belirli detayları değiştirebilirsiniz” ifadesini kullandı.
Arama devinin aktardığı verilere göre Omni, sezgisel bir fizik anlayışına sahip bulunuyor. Modelin üretimleri, fotorealizmi ve hikaye anlatımını geliştirmek adına Gemini’ın tarih, bilim ve kültürel bağlam hakkındaki bilgi birikimine dayanıyor. Yapay zeka modeli, kısa komutlardan yola çıkarak yapay zeka seslendirmeleriyle desteklenmiş açıklayıcı videolar da üretebiliyor.
SynthID Filigranı ve Güvenlik Önlemleri
Sistemde karakterlerin, sahnelerin veya çizimlerin görselleri girdi olarak kullanılabiliyor. Çoklu girdi formatları desteklenmekle birlikte Google, modelin başlangıçta ses için yalnızca konuşma referanslarını destekleyeceğini, diğer ses türlerinin ise daha sonra ekleneceğini belirtti.
Omni kullanılarak oluşturulan tüm videolar, Gemini uygulaması, Chrome ve Google Arama üzerinden doğrulanabilen SynthID filigranını taşıyacak. Kullanıcılar ayrıca Omni tarafından üretilen videolarda yer almak üzere, kendileri gibi görünen ve ses çıkaran bir avatar veya dijital versiyon oluşturabilecek.
Yeni Model Hangi Platformlarda Kullanılabilecek?
Gemini Omni Flash; Google AI Plus, Pro ve Ultra aboneliğine sahip kullanıcılar için Gemini uygulaması ve Google Flow üzerinde yaygınlaştırılmaya başlandı. Model ayrıca YouTube Shorts videolarını yeniden düzenlemek (remix) isteyen kullanıcılar için ücretsiz olarak ve YouTube Create uygulamasında da kullanıma sunuluyor.
Omni modeli, Google’ın bugüne kadarki en güçlü kodlama modeli olan yeni Gemini 3.5 Flash ile birlikte çıkış yaptı.

İlk yorum yapan olun