Gemini 3 Flash’ta “Agentic Vision” ile Doğrulanabilir Çok Modlu Sistemler
ÖzetGoogle, Gemini 3 Flash’ta “Agentic Vision” özelliğini tanıttı. Python kod yürütme özelliğiyle desteklenen bu özellik, yinelemeli bir Düşün → Harekete Geç → Gözlemle döngüsü sunuyor. Model, tek bir “statik bakış” yerine, yakınlaştırma/kırpma/açıklama ekleme ve hesaplama yaparak, cevaplarını doğrulanabilir kanıtlara dayandırıyor. Bu özellik özellikle sayma, küçük yazıları okuma ve grafiklerden/tablolardan değer çıkarma konularında fayda sağlıyor. |
Hangi yenilikler var?
Çoğu çok modlu model, bir görüntüyü bir kez işler ve bu ilk geçişe göre yanıt verir. Küçük bir detayı (küçük metinler, yoğun tablolar, kalabalık nesneler) kaçırdıklarında genellikle tahminde bulunurlar.
Agentic Vision, “tekrar bakmayı” birinci sınıf bir yetenek haline getirerek bunu değiştiriyor: Gemini 3 Flash, cevap vermeden önce görüntüyü manipüle etmek/analiz etmek için plan yapabiliyor, kod çalıştırabiliyor ve ardından kanıtları yeniden kontrol edebiliyor.
Düşün → Harekete Geç → Gözlemle döngüsü
Agentic Vision, özyinelemeli (recursive) bir iş akışı etrafında organize edilmiştir:
- Düşün: Kullanıcı isteğini ve başlangıç görüntüsünü yorumla; nelerin doğrulanması gerektiğine karar ver.
- Harekete Geç: Python kodunu oluştur ve yürüt (örneğin: kırpma/yakınlaştırma, döndürme, açıklama ekleme, hesaplama, çizim yapma).
- Gözlemle: Çıktıları (kırpılmış görüntüler, sayımlar, hesaplamalar, grafikler) modelin bağlamına geri ekle ve devam et (veya yanıtla).

Neden önemli? (Pratik güvenilirlik)
Agentic Vision, “neredeyse doğru” olmanın hala maliyetli olduğu durumlarda çok değerlidir:
- Yoğun sahnelerde sayım yapma (envanter, raf ürünleri, parçalar)
- Küçük yazıları okuma (seri numaraları, etiketler, tabelalar)
- Tablo/grafik ekran görüntülerinden sayısal verileri çıkarma
- Görsel kuralları doğrulama (uyumluluk kontrolleri, plan incelemesi)
Google, Gemini 3 Flash ile kod yürütmeyi etkinleştirmenin çoğu görsel kıyaslama testinde tutarlı bir şekilde %5–10 oranında kalite artışı sağladığını belirtiyor.
Temel yetenekler (Neler inşa edebilirsiniz?)
1) Aktif yakınlaştırma ve inceleme
Gemini 3 Flash, ayrıntıların standart çözünürlük için çok küçük olduğunu örtük olarak algılayabilir ve ilgili bölgeleri kırpıp yeniden incelemek için kod yürütmeyi kullanabilir.
Google, yinelemeli kırpmanın doğruluğu artırdığı bir bina planı doğrulama örneğini vurguluyor.
2) Görsel açıklama ekleme (“Görsel karalama defteri”)
Model, metinle açıklama yapmaya ek olarak görüntü üzerine kutular, etiketler ya da oklar çizebilir ve böylece sayma gibi görevleri denetlenebilir hale getirir.
3) Deterministik görsel matematik ve çizim
Agentic Vision, görsel tablolardan ve grafiklerden değerleri çıkarabilir ve sonuçları hesaplamak ve grafikler (örneğin, Matplotlib) oluşturmak için Python’u kullanabilir. Bu da görsel aritmetikteki halüsinasyonu azaltır.
Nasıl deneyebilirsiniz? (AI Studio, Gemini API, Vertex AI)
A Seçeneği — Google AI Studio (En hızlı demo)
AI Studio arayüzünü kullanın, Gemini 3 Flash‘ı seçin ve Araçlar → Kod Yürütme (Tools → Code Execution) özelliğini etkinleştirin.
B Seçeneği — Gemini API (Programatik)
Gemini 3 Flash önizleme model kimliği ve dokümanlar:
Model sayfası 👉 Gemini 3 Flash Önizleme | Gemini API | Geliştiriciler için Google Yapay Zeka
Gemini 3 rehberi 👉 Gemini 3 Geliştirici Rehberi | Gemini API | Geliştiriciler için Google Yapay Zeka
Kod yürütme aracı 👉 Kod yürütme | Gemini API | Geliştiriciler için Google Yapay Zeka
Minimal Python örneği (Kavramsal)
|
|
C Seçeneği — Vertex AI (Bulut)
Modele genel bakış (Vertex AI üzerinde Gemini 3 Flash) 👉 Gemini 3 Flash | Vertex AI üzerinde üretken yapay zeka | Google Cloud Dokümantasyonu
Vertex AI üzerinde çok modlu modeller için kod yürütme 👉 Kod yürütme | Vertex AI üzerinde üretken yapay zeka | Google Cloud Dokümantasyonu
Sınırlar ve dikkat edilmesi gerekenler (Yayına almadan önce okuyun)
Kod yürütme kısıtlamaları
Kod yürütme için maksimum zaman aşımı süresi 30 saniyedir.
Kaynak 👉 Kod yürütme | Gemini API | Geliştiriciler için Google yapay zeka
Vertex AI referans notları (dosya G/Ç işleminin olmaması dahil) bazı sınırlamalara dikkat çeker.
Kaynak 👉 Gemini API ile kod yürütme | Vertex AI üzerinde üretken yapay zeka | Google Cloud Dokümantasyonu
Önizleme durumu
Gemini 3 Flash, duyuru ve resmi dokümanlarda Genel Önizleme (Public Preview) olarak konumlandırılmıştır.
Kaynak 👉 Gemini 3 Flash’ta “Agentic Vision” Tanıtılıyor
Güvenlik notları (Model kartından)
Resmi Gemini 3 Flash model kartı, Gemini 2.5 Flash’a kıyasla otomatik güvenlik değerlendirme farklarını bildirir ve manuel inceleme bağlamını not eder.
Model kartı ana sayfası 👉 Gemini 3 Flash Model Kartı
Geliştirici örüntüleri (Ajan davranışı güvenilir bir şekilde nasıl elde edilir?)
Bu istem örüntüleri, modelin sadece akıcı cevaplarla kalmayıp, doğrulanabilir çıktılar da üretmesine yardımcı olur:
Örüntü 1 — Kanıt Öncelikli inceleme
“Görüntüyü adım adım incele. Herhangi bir metin küçük veya belirsizse, doğrulamak için yakınlaştır/kırp. Nihai yanıtı döndür ve hangi bölgeleri incelediğini kısaca açıkla.”
Örüntü 2 — Denetlenebilir sayım
“Öğeleri güvenilir bir şekilde say. Sayımın doğrulanabilir olması için görüntüye açıklama eklemeyi bir karalama defteri (kutular/etiketler) gibi kullan. Sayımı bildir ve belirsiz bölgeleri not et.”
Örüntü 3 — Tablo/grafik çıkarma → hesaplama → çizim
“Önce grafik değerlerini bir tabloya aktar. Ardından istenen metriği kod yürütmeyi kullanarak hesapla ve temiz bir grafik oluştur.”
Araç destekli iş akışları için kaynak bağlamı 👉 Gemini 3 Flash’ta “Agentic Vision” Tanıtılıyor
⭐⭐⭐
Agentic Vision, doğrulanabilir çok modlu sistemlere yönelik anlamlı bir adımdır. Gemini 3 Flash, görsel yetenekleri araç destekli kod yürütme ile birleştirerek inceleme yapabilir, açıklama ekleyebilir ve hesaplama gerçekleştirebilir. Bu sayede “muhtemelen doğru” olan birçok görsel yanıtı denetlenmiş kanıtlara daha yakın bir şeye dönüştürür.
Kaynaklar
Agentic Vision duyurusu 👉 Gemini 3 Flash’ta “Agentic Vision” Tanıtılıyor
Vertex AI üzerinde Gemini 3 Flash (dokümanlar) 👉 Gemini 3 Flash | Vertex AI üzerinde üretken yapay zeka | Google Cloud Dokümantasyonu
Gemini 3 Flash önizleme modeli (Gemini API) 👉 Gemini 3 Flash Önizleme | Gemini API | Geliştiriciler için Google yapay zeka
Gemini 3 Geliştirici Rehberi 👉 Gemini 3 Geliştirici Rehberi | Gemini API | Geliştiriciler için Google yapay zeka
Kod yürütme (Gemini API) 👉 Kod yürütme | Gemini API | Geliştiriciler için Google yapay zeka
Kod yürütme (Vertex AI) 👉 Kod yürütme | Vertex AI üzerinde üretken yapay zeka | Google Cloud Dokümantasyonu
Kod yürütme API referansı (Vertex AI) 👉 Gemini API ile kod yürütme | Vertex AI üzerinde üretken yapay zeka | Google Cloud Dokümantasyonu
Gemini 3 Flash model kartı 👉 Gemini 3 Flash Model Kartı
Yazan: Ata Güneş
Yayınlanma Tarihi: 03.03.2026

Benzer Yazılar
Gemini 3 Flash'ta "Agentic Vision" ile Doğrulanabilir Çok Modlu Sistemler
Mar 3, 2026 | Google CloudTelefonun Ötesinde: "Kendi Nesneni Getir" (BYOT) Çağında Kurumsal Güvenliği Sağlamak
Mar 2, 2026 | GüvenlikFiltreleri Bırakın, Sohbete Başlayın: Google Cloud'da Diyaloğa Dayalı Analitik Çağı
Şub 24, 2026 | Google CloudPerakendede 'Omnitüketici' Dönemi: Dijital ve Fiziksel Mağazalar Arasında Kesintisiz Deneyim
Şub 20, 2026 | BulutNotebookLM ile Bilgi Karmaşasından Anlamlı İçgörüler Elde Etmek
Şub 19, 2026 | BulutÖne Çıkan Yazılar
Değişen Dünyanın Dili: VUCA ve BANI
Haz 28, 2022 | Dijital Pazarlama
Türkiyeli Yazılımcılara Aforizmalar
May 14, 2020 | Yazılım Geliştirme
SELinux Nedir? Varsayılan Güvenlik Politikasına Uymayan Durumlara Nasıl İzin Verilir?
Ağu 6, 2013 | Açık KaynakYapay Zeka Çalışma Arkadaşları: Google Illuminate ve NotebookLM Karşılaştırması
Kas 12, 2025 | Eğitim SektörüGoogle Haritalar API'si ile İşletmeniz için Navigasyonun Ötesinde Stratejiler
Nis 2, 2025 | Bulut