Google I/O 2025’te Öne Çıkan Yenilikler
- 58
Google I/O 2025’te yapay zeka ve üretken medya alanındaki gelişmeler hem geliştiriciler hem de son kullanıcılar için yeni ufuklar açtı. Bu yılki etkinlikte Gemini 2.5 modellerinin güncellenen yeteneklerinden Veo 3 ve Imagen 4 gibi üretken içerik araçlarına; Deep Research ve Canvas gibi üretkenlik çözümlerinden “Yapay Zeka Modu” ve “Gemini Live” gibi özelliklere kadar pek çok yenilik duyuruldu. Aşağıda, Mobildev blogunuz için hazırlayabileceğiniz kapsamlı bir blog içeriği bulabilirsiniz.
1. Gemini 2.5 Serisi ve Yenilikleri
Google I/O 2025’te Gemini 2.5 model ailesine yönelik önemli güncellemeler paylaşıldı.
• Gemini 2.5 Pro ve Deep Think (Geliştirilmiş Akıl Yürütme) Modu
Gemini 2.5 Pro, artık “Deep Think” adı verilen deneysel bir mod ile geliyor. Deep Think, bir yanıt vermeden önce birden çok hipotezi değerlendirebiliyor ve özellikle karmaşık matematik, kodlama ve uzun bağlamsal sorularda daha güvenilir sonuçlar sunuyor. Örneğin, 2025 USAMO matematik sınavında üst düzey puan alarak ne kadar güçlü olduğunu kanıtladı.
• Gemini 2.5 Flash
Gemini 2.5 Flash modeli, herkesin kullanımına sunuldu ve kısa süre sonra Google AI Studio ve Vertex AI üzerinden geliştiricilere açılacak. Bu model, daha düşük gecikme süreleriyle yüksek doğruluk sunarken, 1 milyon token’lık geniş içerik penceresi sayesinde uzun metin ve video analizine de uygun.
• Gemini Chrome Entegrasyonu
Artık Gemini, Chrome tarayıcısına entegre edilmiş durumda. Kullanıcılar web’de gezerken doğrudan Gemini’a sorular sorup, sayfada karşılaştıkları karmaşık bilgileri özetlettirebilecek. Bu özellik, şimdilik yalnızca ABD’deki Google AI Pro ve Ultra abonelerine, Windows ve macOS’ta, yalnızca İngilizce dilinde sunuluyor. Yakın gelecekte birden fazla sekme arasında da çalışması ve web siteleri üzerinde proaktif görevler alması planlanıyor.
• Gemini Live
“Gemini Live” özelliği, kamera ve ekran paylaşımıyla gerçek zamanlı iş birliğini destekliyor. Toplantılar, online eğitimler veya uzaktan kod incelemelerinde kullanıcıların canlı olarak içerik paylaşmasına ve ortak çalışmasına olanak tanıyor. Bu sayede, örneğin bir eğitimcinin ders sırasında hem kodu hem de anlatımı gerçek zamanlı olarak tek ekranda sunabilmesi mümkün hale geldi.
2. Üretken Medya Araçları: Veo 3 ve Veo 2 Güncellemeleri
Google, I/O 2025’te özellikle video üretimine odaklanan yeni nesil modellerini tanıttı.
• Veo 3
Veo 3, selefi Veo 2’ye kıyasla sadece görüntü değil, aynı zamanda “natif sesli” videolar oluşturabiliyor. Oluşturulan videolarda arka plan gürültüleri, kuş cıvıltıları veya karakterler arası dialog gibi detaylı ses öğeleri yer alıyor. Dudak senkronizasyonu da oldukça yüksek kalitede: Kullanıcı, kısa bir hikaye yazdığında model bunu sinematik bir klibe dönüştürebiliyor. Veo 3’ün, ABD’deki Ultra seviyesindeki Gemini abonelerine ve Flow platformunda da erişilebilir hale geldiği açıklandı. Kurumsal kullanıcılar ise Vertex AI üzerinden API aracılığıyla modele erişebiliyor.
• Veo 2 Güncellemeleri
- Veo 2’ye “referans destekli video” özelliği eklendi. Kullanıcılar artık modele karakterlerin, sahnelerin, nesnelerin veya stillerin referans görüntülerini verebiliyor.
- Kamera kontrolleri ile döndürme, dolaştırma ve yakınlaştırma gibi hassas ayarlamalar yapılabiliyor.
- “Dış boyama” (outpainting) özelliği sayesinde bir videoyu dikey formatta genişletip yatay formata uyarlamak mümkün.
- Veo 2’ye “nesne ekleme/kaldırma” özelliği de getirildi. Örneğin bir videodaki bir objeyi silebilir ya da yeni bir nesne ekleyebilirsiniz.
- Tüm bu yenilikler önümüzdeki haftalarda Flow ve Vertex AI API’da, sonraki aylarda ise diğer Google ürünlerinde kullanıma açılacak.
3. Flow: Yapay Zeka Destekli Film Yapım Aracı
• Flow’un Temelleri
Flow, Veo, Imagen ve Gemini modellerini tek bir platformda toplayan yapay zeka tabanlı film yapım aracıdır. Kullanıcılar, doğal dilde yazdıkları yönergelerle (örneğin “gün batımında araba sahnesi, hafif rüzgarlı bir hava, dramatik müzik”) sinematik klipler oluşturabiliyor.
Oyuncular, mekanlar, nesneler ve stil bileşenleri, metin tabanlı komutlarla tek bir yerden yönetiliyor. Örneğin, Flow’a “Bir polis merkezinde geçen aksiyon sahnesi, hızlı kamera hareketleri ve dramatik müzik eşliğinde” dediğinizde, model buna uygun sahneyi otomatik üretebilecek.
• Kullanım Alanları ve Erişim
ABD’deki Google AI Pro ve Ultra aboneleri şu an için Flow’a erişebiliyor. Yakında daha fazla ülkeye açılması planlanıyor. Flow, kısa bir klibi uzun bir sahneye dönüştürme, birden fazla çekimi bir araya getirerek “dizi benzeri” hikâyeler yaratma veya bir storyboard’u otomatik olarak filme dönüştürme gibi gelişmiş yetenekler sunuyor.
4. Imagen 4: Görsel Üretimde Yeni Dönem
• Görsel Kalite ve Tipografi
Imagen 4, önceki sürümlere kıyasla girift kumaş dokuları, su damlacıkları ve hayvan kürkü gibi detayları olağanüstü netlikte üretiyor.
Model; gerçekçi fotoğraf, soyut sanat, hatta metin yerleştirilmiş görsellerde bile yüksek kalitede sonuçlar sunuyor. 2K çözünürlüğe kadar farklı en-boy oranlarında çıktılar oluşturabiliyor.
Yazı, tipografi ve metin içeren grafikler konusunda da önemli geliştirmeler var. Örneğin bir sunum slaytında başlık ve alt başlıkları profesyonelce yerleştirmek mümkün.
• Entegrasyon
Imagen 4, Gemini uygulaması, Whisk, Vertex AI ve Workspace üzerindeki Slaytlar, Vids, Dokümanlar gibi araçlarla entegre olarak kullanılabiliyor.
Google Labs Başkanı Josh Woodward, Imagen 4’ün slayt, davetiye veya metin-görsel birleştirme gereken her türlü içeriğe uygun olduğunu vurguladı.
5. Deep Research ve Canvas ile Üretkenlikte Yeni Boyut
• Deep Research
Gemini Deep Research, karmaşık araştırma görevlerini otomatikleştiriyor: Bir soruyu parçalarına ayırıp web’i tarayarak hızlıca özet raporlar oluşturuyor.
I/O 2025’te duyurulan en son güncellemelerle Deep Research artık 2.5 Flash modelini kullanabiliyor, PDF ve resim dosyalarını doğrudan yükleyebiliyor ve Google Drive’daki belgeleri kaynak olarak alabiliyor. Bu sayede hem kamu verisi hem de kullanıcıya ait özel içerikler bir arada işlenebiliyor.
• Canvas
“Canvas”, Gemini uygulaması içinde gerçek zamanlı kodlama, belge ve sunum hazırlama imkânı sunan bir çalışma alanı.
Kullanıcılar; interaktif infografik, quiz, hatta podcast tarzı sesli özetler oluşturabilecek. Canvas, kodlarınızı canlı önizleme ile çalıştırmanıza ve üzerinde düzenleme yapmanıza izin veriyor.
Google I/O sunumunda, Canvas üzerinde 45 farklı dilde içerik üretimi gösterildi. Mesela bir infografiği doğrudan metinden otomatik oluşturabiliyorsunuz.
6. Arama’da “Yapay Zeka Modu” ve “Gemini Live”
• Yapay Zeka Modu
“Yapay Zeka Modu”, Google Arama’ya entegre edilen gelişmiş bir kullanıcı arayüzü. Şimdilik yalnızca ABD’de, Labs’e kayıt olmadan kullanıma açıldı. Bu modda, Gemini 2.5’in özel bir versiyonu Arama sonuçlarına entegre edilecek. Bu sayede kullanıcılar; sorgularına derinlemesine analiz, görsellerin açıklanması ve daha bağlamsal cevap alma imkânı bulacak.
• Gemini Live
Yukarıda da bahsettiğimiz gibi Gemini Live, arama veya diğer uygulamalarda gerçek zamanlı etkileşim sunuyor. Arama sonuçlarında bir bilgi görürken, “Bu terim nedir?”, “Bana alternatif örnekler göster” ya da “Daha derin bir analiz yap” gibi interaktif komutlar verebileceksiniz.
Ayrıca Gemini Live, kamera ve ekran paylaşımı özellikleriyle, özellikle e-öğrenme senaryolarında hem öğretmen hem öğrenci odaklı deneyimleri geliştiriyor.
Google I/O 2025’te duyurulan yenilikler, hem yapay zekânın hem de üretken medya araçlarının ne kadar hızla geliştiğini gözler önüne serdi. Gemini 2.5 modellerinin Deep Think ve Flash sürümleri, geliştiricilere kodlama ve araştırmada yeni imkânlar sunarken; Veo 3 ve Imagen 4 gibi araçlar, video ve görsel üretimi yeniden tanımlıyor. Flow platformu, kısa bir metni uzun bir sahneye dönüştürme yeteneğiyle sinema dünyasını dönüştürürken, Deep Research ve Canvas sayesinde kullanıcılar fikir aşamasından prototipe çok daha hızlı geçebiliyor. Arama’ya entegre edilen “Yapay Zeka Modu” ve “Gemini Live” gibi özellikler ise günlük kullanıcı deneyimini zenginleştiriyor.