
Google, I/O 2025 etkinliğinde, yapay zeka destekli yeni video üretim modeli Veo 3'ü tanıttı. OpenAI’ın Sora modeliyle doğrudan rekabet eden Veo 3, yalnızca video oluşturmakla kalmıyor; eş zamanlı olarak ses efektleri, arka plan sesleri ve karakter diyalogları da üretebiliyor. Google, bu özellik sayesinde “sessiz dönem” olarak tanımladığı geleneksel yapay zeka video üretimini geride bıraktığını vurguladı.
Google DeepMind CEO’su Demis Hassabis, kullanıcıların artık sahnede geçen diyaloğu ve bu diyaloğun nasıl duyulmasını istediklerini de tarif edebileceğini belirtti. Veo 3, sahnedeki görsellerle sesleri gerçekçi biçimde senkronize edebiliyor; dudak hareketleri, fizik kuralları ve görsel-ses uyumu açısından önceki modellere göre önemli bir ilerleme kaydetmiş durumda.
Yeni model, ayda 249,99 dolarlık abonelik bedeliyle sunulan Google AI Ultra planı kapsamında ABD'deki kullanıcılar için Gemini uygulamasında erişime açıldı. Ayrıca kurumsal müşteriler için Vertex AI platformuna da entegre edildi.
Veo 3’ün geliştirilmesinde, Google DeepMind’ın geçen yıl tanıttığı video tabanlı ses üretimi araştırmaları temel alındı. Google, telif hakkı ve içerik manipülasyonu endişelerine karşı, üretilen içeriklerde SynthID adlı görünmez dijital işaretleme teknolojisini de kullanıyor.
Google ayrıca, önceki nesil olan Veo 2 için de güncellemeler sundu. Artık kullanıcılar video içerisine nesne ekleyip çıkarabiliyor, sahneleri genişletebiliyor ve farklı kamera hareketlerini taklit edebiliyor. Bu gelişmiş düzenleme yeteneklerinin kısa süre içinde Vertex AI API kullanıcılarına sunulması planlanıyor.
Video üretiminde sesli yapay zekâ dönemine geçiş niteliği taşıyan Veo 3, Google’ın OpenAI, Runway, Pika ve Luma gibi güçlü rakiplerin yer aldığı rekabetçi pazarda fark yaratma çabasının en somut örneklerinden biri olarak değerlendiriliyor.