BigQuery’de Üretken Yapay Zeka ve Makine Öğrenmesi: Hangi Yenilikler Var?
Veri analistleri ile yapay zekanın etkin kullanımı arasındaki boşluk hızla kapanıyor. Verileriniz üzerinde büyük dil modelleri (LLM) çalıştırmak için karmaşık Python işlem hatlarına, verilerinizi taşıma veya özel altyapı kurma zorunluluğu geride kaldı. Google Cloud’un en son güncellemeleriyle artık Gemini 3.1, Claude, Mistral ve Llama dahil olmak üzere en gelişmiş üretken modellere standart SQL kullanarak doğrudan BigQuery içerisinden erişebilirsiniz.
Bu yazıda BigQuery’deki yeni yapay zeka ve makine öğrenmesi fonksiyon setini, bu fonksiyonların yeteneklerini ve veri ambarınızı bir yapay zeka motoruna dönüştürmek için güvenliği nasıl yönettiklerini inceleyeceğiz.
Yeni Fonksiyonlar ve Temel Yetenekleri
BigQuery, Vertex AI modellerini çağırma yükünü üstlenen bir dizi yerel SQL fonksiyonu tanıttı. Bu yeni fonksiyonlar; harici altyapı yönetimine, metin oluşturmaya, yapılandırılmamış verileri kategorize etmeye, vektör yerleştirmeleri (embeddings) oluşturmaya ve semantik aramalar yapmaya olanak tanıyor.
1. AI.GENERATE ve ML.GENERATE_TEXT
Metin ve Yapı Konusunda Çok Yönlü Bir Çözüm
AI.GENERATE, BigQuery içindeki temel üretken yapay zeka fonksiyonudur. Veriyi dışa aktarmadan veya harici işlem hatları kurmadan metin, görüntü, ses ve belgeleri işlemek için temel modelleri doğrudan SQL’den çağırmanızı sağlar.
Temel Yetenekler
- Çok Modlu İşleme (Multimodal Processing):
AI.GENERATEfonksiyonunun tek bir SQL sorgusu içinde karışık girdi türlerini analiz etmesini sağlar. Metin, görüntü, ses ve belgeleri birlikte işleyebilir; kullanıcıların bir görsel hakkında soru sormasına, bir video transkriptini özetlemesine, PDF’lerden içgörü çıkarmasına veya tek bir istemde yapılandırılmış ve yapılandırılmamış verileri birleştirmesine olanak tanır. - Esnek Çıktı Kontrolü: Fonksiyonun hem serbest formatlı metinler hem de yapılandırılmış yanıtlar üretmesini sağlar. Özet, açıklama, çeviri ve içerik üretmede mükemmel olmasının yanı sıra,
output_schemaparametresini de destekler. Bu parametre, çıktının JSON veya belirli sütun türleri gibi tanımlanmış bir yapıya uygun olmasını sağlayarak, sonuçların sonraki SQL iş akışlarında doğrudan kullanılabilmesini sağlar. - Geniş Görev Kapsamı: Tek bir fonksiyonun özetleme, çeviri, varlık çıkarma, duygu analizi, sınıflandırma ve yapılandırılmış veri çıkarma dahil olmak üzere yapay zeka odaklı birden fazla işlemi yürütebileceği anlamına gelir. Bu sayede, birden fazla uzmanlaşmış modele ihtiyaç ortadan kalkar ve yapay zeka entegrasyonu doğrudan BigQuery içinde basitleştirilir.
Kullanım Örneği: Üretken Yapay Zeka ile Otomatik Makale Zenginleştirme
Bu sorgu, bir medya kuruluşunun yapılandırılmamış haber makalelerini doğrudan BigQuery içinde nasıl otomatik olarak zenginleştirebileceğini gösteriyor. AI.GENERATE kullanarak tek bir SQL ifadesinde; teknoloji makalelerini seçer, anahtar varlıkları çıkarır, ana konuları belirler, duygu analizi yapar ve içeriği Çinceye çevirir. Sonuçta, verileri dışa aktarmadan veya harici yapay zeka işlem hatları kurmadan, ham metinden yapılandırılmış ve analize hazır veriler üretilir.
SELECT
title,
body,
AI.GENERATE(
body,
output_schema =>
"key_entities ARRAY<STRING>, main_topics ARRAY<STRING>, sentiment STRING, translate_to_chinese STRING, summary_one_sentence STRING").*
EXCEPT (full_response, status)
FROM bigquery-public-data.bbc_news.fulltext
WHERE category = 'tech'
LIMIT 3;

AI.GENERATE kullanıcı deneyiminizi yalınlaştırır. ML.GENERATE_TEXT ise, özellikle temperature, top_k ve safety_settings gibi parametreler üzerinde hassas kontrole sahip ince ayarlı bir Gemini modeli kullanmanız gerektiğinde, uzaktaki modelleri çağırmak için sağlam bir temel oluşturur.
2. AI.GENERATE_TABLE
Yapılandırılmış Veri Dönüştürücü
AI.GENERATE_TABLE, yapılandırılmamış girdilere dayalı yapılandırılmış veri tabloları döndürmek için özel olarak tasarlanmış bir varyasyondur. Düzensiz metin günlüklerini veya incelemeleri temiz satırlara ve sütunlara dönüştürmek için idealdir; çıktıyı anında sorgulanabilir hale getirir.
Temel Yetenekler
- Sıkı Şema Zorunluluğu: Çıktı yapısını açıkça tanımlarsınız (örneğin,
ageINT64,is_marriedBOOL,diagnosisSTRING). Fonksiyon, modelin yanıtının bu veri türlerine uygun olduğunu doğrulayarak BigQuery içinde temiz, güçlü tür yapılandırmalı (strongly typed) ve anında sorgulanabilir sonuçlar sağlar. - Düzensiz Verileri Temizleme: Müşteri değerlendirmeleri, çağrı merkezi transkriptleri veya tıbbi notlar gibi yapılandırılmamış veya tutarsız girdileri standartlaştırılmış, analize hazır tablolara dönüştürmek için tasarlanmıştır. Manuel ayrıştırma mantığını ortadan kaldırır ve sonraki veri temizleme gereksinimlerini azaltır.
Kullanım Örneği: Klinik Notlardan Yapılandırılmış Tıbbi Veri Çıkarma
Bu sorgu, bir sağlık analiz ekibinin yapılandırılmamış tıbbi transkripsiyon metnini doğrudan BigQuery içinde yapılandırılmış, sorgulanabilir klinik verilere nasıl dönüştürebileceğini gösteriyor. Ham tıbbi notları seçer ve hasta yaşını, kan basıncını (sistolik ve diyastolik), kilosunu, tıbbi durumlarını, tanılarını ve reçete edilen ilaçları çıkarmak için tanımlanmış bir şema ile AI.GENERATE_TABLE kullanır. Fonksiyon, sıkı veri türlerini (örneğin, INT64, FLOAT64, ARRAY
SELECT
age,
blood_pressure,
weight,
conditions,
diagnosis,
medications,
prompt
FROM
AI.GENERATE_TABLE(MODEL bqml_tutorial.gemini25flash,
(
SELECT
input_text AS prompt
FROM
bqml_tutorial.kaggle_medical_transcriptions
LIMIT
3),
STRUCT(
"age INT64, blood_pressure STRUCT<high INT64, low INT64>, weight FLOAT64, conditions ARRAY<STRING>, diagnosis ARRAY<STRING>, medications ARRAY<STRING>" AS output_schema,
1024 AS max_output_tokens))

3. AI.CLASSIFY
Otomatik Kategorizasyon
Genel bir LLM’den de bir şeyi “kategorize etmesini” isteyebilirsiniz. Fakat AI.CLASSIFY, girdileri tanımlanmış bir etiket kümesiyle eşleştirmek üzere optimize edilmiştir.
Temel Yetenekler
Bir kategori listesi (örneğin, [‘acil’, ‘rutin’, ‘spam’]) veya açıklamaları içeren bir JSON haritası sağlarsınız ve fonksiyon en uygun olanı döndürür. Sınıflandırma kalitesini artırmak için girdiyi otomatik olarak yapılandırır.
Kullanım Örneği: Otomatik Haber Kategorizasyonunu Ölçeklendirme
Bu sorgu, bir medya kuruluşunun büyük hacimli haber makalelerini doğrudan BigQuery içinde nasıl otomatik olarak sınıflandırabileceğini gösteriyor. AI.CLASSIFY kullanılarak her makale gövdesi, teknoloji, spor, iş, siyaset veya eğlence gibi önceden tanımlanmış kategorilerden birine atanır. Daha sonra sonuçlar her kategoriye kaç makalenin düştüğünü saymak için birleştirilir. Böylelikle ayrı makine öğrenmesi modelleri oluşturmadan veya verileri veri ambarı dışına aktarmadan gerçek zamanlı içerik etiketleme, editoryal analiz ve trend izleme mümkün hale gelir.
SELECT
AI.CLASSIFY(
body,
categories => ['tech', 'sport', 'business', 'politics', 'entertainment'],
connection_id => 'us.test_connection') AS category,
COUNT(*) num_articles
FROM bigquery-public-data.bbc_news.fulltext
GROUP BY category;
4. AI.EMBED ve ML.GENERATE_EMBEDDING
Semantik Aramanın Temeli
Bu fonksiyonlar metin, görüntü veya videoları, anlamı temsil eden sayısal vektörler olan “yerleştirmelere” (embeddings) dönüştürür.
Temel Yetenekler
Veriler yerleştirildikten sonra, öğeleri sadece anahtar kelimelerle eşleştirmek yerine “en yakın eşleşmeleri” bulmak için matematiksel olarak karşılaştırabilirsiniz. AI.EMBED, yerleştirmeler oluşturmak için daha yeni ve basitleştirilmiş bir söz dizimidir. ML.GENERATE_EMBEDDING ise Temel Bileşen Analizi (PCA) ve Matris Faktörizasyonu gibi görevler için detaylı kontroller sunar.
Kullanım Örneği: Akıllı Arama ve Getirme için Semantik Yerleştirmeler Oluşturma
Bu sorgu, bir medya kuruluşunun AI.EMBED kullanarak doğrudan BigQuery içindeki haber makaleleri için nasıl vektör yerleştirmeleri oluşturabileceğini gösteriyor. Her makale için gövde metni, belirtilen yerleştirme modeli kullanılarak yüksek boyutlu bir sayısal temsile dönüştürülür. Bu yerleştirmeler daha sonra anlamsal arama, benzerlik eşleştirme, öneri sistemleri ve kümelemeyi destekleyebilir. Bu sayede, verileri harici bir vektör işleme sistemine aktarmadan daha akıllı içerik keşfi ve kişiselleştirme yapılabilir.
SELECT title, body, AI.EMBED( body, endpoint => "text-embedding-005" ).result FROM `bigquery-public-data.bbc_news.fulltext` LIMIT 3;

5. AI.SIMILARITY
Semantik Arama Artık Çok Basit
Bu skaler fonksiyon, iki girdi arasındaki (metin ve metin veya metin ve görüntü) anlamsal benzerlik puanını hesaplar.
Temel Yetenekler
Yerleştirme oluşturma ve kosinüs benzerliği hesaplama işlemlerini tek bir adımda gerçekleştirir. Geçici (ad hoc) analizler için vektörleri önceden hesaplama ihtiyacını ortadan kaldırır.
Kullanım Örneği: İlgili Haber Makaleleri için Anlamsal Arama
Bu sorgu, bir medya veya finansal analiz ekibinin doğrudan BigQuery içinde anlamsal aramayı nasıl gerçekleştirebileceğini gösteriyor. AI.SIMILARITY kullanarak, “konut piyasasındaki düşüş eğilimleri” şeklindeki doğal dil sorgusunu, metin yerleştirmelerinden yararlanarak her haber makalesinin gövdesiyle karşılaştırır. Anahtar kelime eşleştirmek yerine semantik anlama dayalı bir benzerlik puanı hesaplar, makaleleri buna göre sıralar ve en fazla ilgili olan ilk beş sonucu döndürür. Böylelikle harici bir vektör veritabanı kurmadan bağlama duyarlı içerik getirme, trend takibi ve akıllı araştırma iş akışları mümkün olur.
SELECT "housing market downward trends" AS query, title AS bbc_news_title, body AS bbc_news_body, AI.SIMILARITY( "housing market downward trends", body, endpoint => "text-embedding-005") AS similarity_score FROM `bigquery-public-data.bbc_news.fulltext` ORDER BY similarity_score DESC LIMIT 5;
Özet Tablo – BigQuery Üretken Yapay Zeka Fonksiyonları ve Özellikleri
| Fonksiyon | Fonksiyon Türü | Temel Kullanım Örneği | Çıktı Formatı |
|---|---|---|---|
AI.GENERATE |
Skaler Fonksiyon (Satır başına tek bir değer/yapı döndürür.) | Genel amaçlı çok modlu üretim, özetleme, çeviri ve geçici analizler | Serbest formatlı metin (STRING) veya bir output_schema sağlanmışsa yapılandırılmış JSON (STRUCT) |
ML.GENERATE_TEXT |
Tahmin Fonksiyonu (Girdi tablosuna sütunlar ekler.) | Derin parametre kontrollü gelişmiş model çıkarımı veya Gemini dışı üçüncü parti ya da açık modellerin kullanımı. | Modelin tam yanıtını içeren JSON payload veya girdiye eklenen düzleştirilmiş metin sütunları |
AI.GENERATE_TABLE |
Tablo Değerli Fonksiyon (TVF) (Tam bir tablo döndürür.) | Yapay zeka destekli ETL; düzensiz ve yapılandırılmamış verileri sıkı veritabanı satır ve sütunlarına dönüştürme | Kullanıcı tanımlı sütunlara ve veri türlerine (örneğin, INT64, STRING, BOOL) sahip sıkı bir BigQuery tablosu |
AI.CLASSIFY |
Skaler Fonksiyon | Metin veya görsel verilerin önceden tanımlanmış etiketlere göre otomatik olarak kategorize edilmesi | STRING (Girdiye en uygun kategori adı) |
AI.EMBED |
Skaler Fonksiyon | Semantik arama oluşturmak için sayısal vektörlerin (yerleştirmelerin) basitleştirilmiş üretimi | Vektör Dizisi (Sayısal vektör) |
ML.GENERATE_EMBEDDING |
Tahmin Fonksiyonu (Girdi tablosuna sütunlar ekler.) | Sağlam yerleştirme üretimi ve gelişmiş matematiksel temsil (PCA, Autoencoders, Matrix Factorization) | Girdiye eklenen ARRAY<FLOAT64> (Üretilen yerleştirmeler) |
AI.SIMILARITY |
Skaler Fonksiyon | Geçici (ad-hoc) semantik arama; kavramsal olarak ilgili öğeleri bulma | FLOAT (Kosinüs benzerliği puanı) |
Gemini’den Açık Kaynağa Desteklenen Modeller
BigQuery artık çok çeşitli modelleri destekleyerek size maliyet ve performans arasında doğru dengeyi kurma esnekliği sunuyor.
- Google Modelleri: Gemini ailesi (Gemini 3.1 Pro/Flash dahil) ve Vertex AI metin/çok modlu yerleştirme modelleri için tam destek sunar.
- İş Ortağı Modelleri: Anthropic Claude, Mistral ve Meta Llama gibi Google tarafından yönetilen iş ortağı modellerini kullanarak doğrudan SQL üzerinden çıkarım yapabilirsiniz.
- Açık Modeller: Hugging Face ve Vertex AI Model Garden aracılığıyla, gemma-3-1b-it gibi açık modelleri aşağıda gösterildiği gibi basit bir
CREATE MODELifadesiyle dağıtabilirsiniz. BigQuery gerekli hesaplama kaynaklarını otomatik olarak hazırlar ve temizleme dahil yaşam döngüsü yönetimini gerçekleştirir.
CREATE OR REPLACE MODEL my_dataset.managed_text_model REMOTE WITH CONNECTION DEFAULT OPTIONS ( model_garden_model_name = 'publishers/google/models/gemma3@gemma-3-1b-it' );
BigQuery Üretken Yapay Zekanın Gerçek Dünyadan Kullanım Örnekleri
Yapılandırılmış iş verilerini yapılandırılmamış yapay zeka işlemeyle birleştirme yeteneği, sektörler genelinde pek çok yeni fırsat ortaya çıkarmaktadır.
- Perakende ve E-Ticaret: SEO için ürün görsellerini metin açıklamalarına dönüştürün, müşteri incelemelerini duyguya göre sınıflandırın veya yerleştirmeleri kullanarak görsel arama araçları oluşturun.
- Sağlık: Tanımlanmış bir çıktı şemasıyla
AI.GENERATEkullanarak yapılandırılmamış doktor notlarından veya giriş formlarından yapılandırılmış hasta verilerini (örneğin yaş, semptomlar, ilaç) çıkarın. - Finans: Anomali tespiti yapmak veya dolandırıcılığa işaret edebilecek kavramsal olarak benzer işlem açıklamalarını bulmak için
AI.SIMILARITYkullanın. - Medya ve Yayıncılık: İçerik etiketlemeyi otomatikleştirin, makaleleri farklı dillere çevirin ve milyonlarca arşivlenmiş belge için başlık veya özet oluşturun.
Güvenlik ve Kimlik Yönetimi
Yapay zekanın veritabanına entegre edilmesi haklı güvenlik sorularını gündeme getirir. Google Cloud, yönetişime ve kullanım kolaylığına odaklanarak bunu basitleştirdi.
- Son Kullanıcı Kimlik Bilgileri (EUC): Eskiden karmaşık hizmet hesabı anahtarlarını yönetmeniz gerekiyordu. Artık BigQuery, Vertex AI isteklerini kişisel IAM kimliğinizi (Son Kullanıcı Kimlik Bilgileri) kullanarak doğrulayabiliyor. Hesabınız “Vertex AI Kullanıcısı” rolüne sahipse bu sorguları ara bağlantılar kurmadan hemen çalıştırabilirsiniz.
- Bütünleşik Yönetişim: İş akışı BigQuery içerisinde gerçekleştiği için mevcut veri yönetişimi politikalarınız geçerli olmaya devam eder. Verilerin işlenmek için güvenli olmayan ortamlara aktarılması gerekmez.
- Güvenlik Filtreleri:
ML.GENERATE_TEXTveAI.GENERATE_TABLEgibi fonksiyonlar nefret söylemi, taciz ve tehlikeli içerikler için eşikler belirlemenize olanak tanıyansafety_settingsparametresini destekler. Model, bu güvenlik standartlarını ihlal eden yanıtları filtreleyecektir. - Kaynak Yönetimi: BigQuery, açık modellerin arka plandaki kaynak hesaplamasını otomatik olarak yönetir. Uç nokta, önceden belirtilmiş bir süre boyunca boşta kaldığında kaynakları serbest bırakır ve maliyetleri durdurur.
⭐⭐⭐
BigQuery’deki en son yapay zeka ve makine öğrenmesi fonksiyonları, gerçekten SQL tabanlı yapay zekaya doğru önemli bir evrimi işaret ediyor. Kurumlar, modelleri doğrudan veriye getirerek ekiplerinin halihazırda güvendiği tanıdık SQL ortamından ayrılmadan denemeleri hızlandırabilir, mimari yükü azaltabilir ve yapılandırılmamış verilerden içgörüler çıkarmaya başlayabilir.
Bu yaklaşım sadece uygulamayı basitleştirmekle kalmaz; veriden değere giden yolu temelden kısaltır. BigQuery veri setlerini zenginleştirme, iş akışlarını otomatikleştirme ve akıllı analizler oluşturmada yaptığı atılımlarla, hızla hem veri hem de yapay zeka için bütünleşik bir platform haline geliyor.
Bir sonraki adımı atmaya hazır mısınız? BigQuery’nin genel veri setlerini kullanarak yapay zeka fonksiyonlarını hemen keşfetmeye başlayın ve ham verilerden ne kadar hızlı eyleme dönüştürülebilir zeka elde edebileceğinizi görün.
Etkinizi ölçeklendirmeye hazır mısınız? Google Cloud’da yapay zeka destekli veri çözümlerinizi tasarlamak, dağıtmak ve ölçeklendirmek için bizimle iletişime geçin.
Yazan: Umniyah Abbood
Yayınlanma Tarihi: 02.04.2026

Benzer Yazılar
BigQuery'de Üretken Yapay Zeka ve Makine Öğrenmesi: Hangi Yenilikler Var?
Nis 2, 2026 | Google CloudAçık Veri Gölü Evi (Lakehouse) Mimarisi: BigQuery, BigLake ve Apache Iceberg ile Veri Yönetimi
Mar 31, 2026 | Google CloudDialogflow CX'ten Sohbet Tabanlı Yapay Zeka Sistemlerine: Bilmeniz Gereken En Büyük Yenilikler
Mar 26, 2026 | Google CloudGemini 3.1 Flash Image: Aslına Sadık Görsel İçi Çeviri Teknolojisi ile Eğitimde Sınırlar Kalkıyor
Mar 24, 2026 | Eğitim SektörüAkıllı Lojistik Merkezleri: Veri Odaklı Depolama ve Dağıtım Optimizasyonu
Mar 23, 2026 | BulutÖne Çıkan Yazılar
Değişen Dünyanın Dili: VUCA ve BANI
Haz 28, 2022 | Dijital Pazarlama
Türkiyeli Yazılımcılara Aforizmalar
May 14, 2020 | Yazılım Geliştirme
SELinux Nedir? Varsayılan Güvenlik Politikasına Uymayan Durumlara Nasıl İzin Verilir?
Ağu 6, 2013 | Açık KaynakYapay Zeka Çalışma Arkadaşları: Google Illuminate ve NotebookLM Karşılaştırması
Kas 12, 2025 | Eğitim SektörüGoogle Haritalar API'si ile İşletmeniz için Navigasyonun Ötesinde Stratejiler
Nis 2, 2025 | Bulut