Müşterilerimiz İletişim EN

BigQuery’de Üretken Yapay Zeka ve Makine Öğrenmesi: Hangi Yenilikler Var?


Veri analistleri ile yapay zekanın etkin kullanımı arasındaki boşluk hızla kapanıyor. Verileriniz üzerinde büyük dil modelleri (LLM) çalıştırmak için karmaşık Python işlem hatlarına, verilerinizi taşıma veya özel altyapı kurma zorunluluğu geride kaldı. Google Cloud’un en son güncellemeleriyle artık Gemini 3.1, Claude, Mistral ve Llama dahil olmak üzere en gelişmiş üretken modellere standart SQL kullanarak doğrudan BigQuery içerisinden erişebilirsiniz.


Bu yazıda BigQuery’deki yeni yapay zeka ve makine öğrenmesi fonksiyon setini, bu fonksiyonların yeteneklerini ve veri ambarınızı bir yapay zeka motoruna dönüştürmek için güvenliği nasıl yönettiklerini inceleyeceğiz.


Yeni Fonksiyonlar ve Temel Yetenekleri

BigQuery, Vertex AI modellerini çağırma yükünü üstlenen bir dizi yerel SQL fonksiyonu tanıttı. Bu yeni fonksiyonlar; harici altyapı yönetimine, metin oluşturmaya, yapılandırılmamış verileri kategorize etmeye, vektör yerleştirmeleri (embeddings) oluşturmaya ve semantik aramalar yapmaya olanak tanıyor.




1. AI.GENERATE ve ML.GENERATE_TEXT


Metin ve Yapı Konusunda Çok Yönlü Bir Çözüm

AI.GENERATE, BigQuery içindeki temel üretken yapay zeka fonksiyonudur. Veriyi dışa aktarmadan veya harici işlem hatları kurmadan metin, görüntü, ses ve belgeleri işlemek için temel modelleri doğrudan SQL’den çağırmanızı sağlar.


Temel Yetenekler

  • Çok Modlu İşleme (Multimodal Processing): AI.GENERATE fonksiyonunun tek bir SQL sorgusu içinde karışık girdi türlerini analiz etmesini sağlar. Metin, görüntü, ses ve belgeleri birlikte işleyebilir; kullanıcıların bir görsel hakkında soru sormasına, bir video transkriptini özetlemesine, PDF’lerden içgörü çıkarmasına veya tek bir istemde yapılandırılmış ve yapılandırılmamış verileri birleştirmesine olanak tanır.
  • Esnek Çıktı Kontrolü: Fonksiyonun hem serbest formatlı metinler hem de yapılandırılmış yanıtlar üretmesini sağlar. Özet, açıklama, çeviri ve içerik üretmede mükemmel olmasının yanı sıra, output_schema parametresini de destekler. Bu parametre, çıktının JSON veya belirli sütun türleri gibi tanımlanmış bir yapıya uygun olmasını sağlayarak, sonuçların sonraki SQL iş akışlarında doğrudan kullanılabilmesini sağlar.
  • Geniş Görev Kapsamı: Tek bir fonksiyonun özetleme, çeviri, varlık çıkarma, duygu analizi, sınıflandırma ve yapılandırılmış veri çıkarma dahil olmak üzere yapay zeka odaklı birden fazla işlemi yürütebileceği anlamına gelir. Bu sayede, birden fazla uzmanlaşmış modele ihtiyaç ortadan kalkar ve yapay zeka entegrasyonu doğrudan BigQuery içinde basitleştirilir.

Kullanım Örneği: Üretken Yapay Zeka ile Otomatik Makale Zenginleştirme

Bu sorgu, bir medya kuruluşunun yapılandırılmamış haber makalelerini doğrudan BigQuery içinde nasıl otomatik olarak zenginleştirebileceğini gösteriyor. AI.GENERATE kullanarak tek bir SQL ifadesinde; teknoloji makalelerini seçer, anahtar varlıkları çıkarır, ana konuları belirler, duygu analizi yapar ve içeriği Çinceye çevirir. Sonuçta, verileri dışa aktarmadan veya harici yapay zeka işlem hatları kurmadan, ham metinden yapılandırılmış ve analize hazır veriler üretilir.


SELECT
  title,
  body,
  AI.GENERATE(
    body,
    output_schema =>
      "key_entities ARRAY<STRING>, main_topics ARRAY<STRING>, sentiment STRING, translate_to_chinese STRING, summary_one_sentence STRING").*
    EXCEPT (full_response, status)
FROM bigquery-public-data.bbc_news.fulltext
WHERE category = 'tech'
LIMIT 3;

Daha İyi Veri Analizi İçin Yeni BigQuery Üretken Yapay Zeka Fonksiyonları

AI.GENERATE kullanıcı deneyiminizi yalınlaştırır. ML.GENERATE_TEXT ise, özellikle temperature, top_k ve safety_settings gibi parametreler üzerinde hassas kontrole sahip ince ayarlı bir Gemini modeli kullanmanız gerektiğinde, uzaktaki modelleri çağırmak için sağlam bir temel oluşturur.


2. AI.GENERATE_TABLE


Yapılandırılmış Veri Dönüştürücü

AI.GENERATE_TABLE, yapılandırılmamış girdilere dayalı yapılandırılmış veri tabloları döndürmek için özel olarak tasarlanmış bir varyasyondur. Düzensiz metin günlüklerini veya incelemeleri temiz satırlara ve sütunlara dönüştürmek için idealdir; çıktıyı anında sorgulanabilir hale getirir.


Temel Yetenekler

  • Sıkı Şema Zorunluluğu: Çıktı yapısını açıkça tanımlarsınız (örneğin, age INT64, is_married BOOL, diagnosis STRING). Fonksiyon, modelin yanıtının bu veri türlerine uygun olduğunu doğrulayarak BigQuery içinde temiz, güçlü tür yapılandırmalı (strongly typed) ve anında sorgulanabilir sonuçlar sağlar.
  • Düzensiz Verileri Temizleme: Müşteri değerlendirmeleri, çağrı merkezi transkriptleri veya tıbbi notlar gibi yapılandırılmamış veya tutarsız girdileri standartlaştırılmış, analize hazır tablolara dönüştürmek için tasarlanmıştır. Manuel ayrıştırma mantığını ortadan kaldırır ve sonraki veri temizleme gereksinimlerini azaltır.

Kullanım Örneği: Klinik Notlardan Yapılandırılmış Tıbbi Veri Çıkarma

Bu sorgu, bir sağlık analiz ekibinin yapılandırılmamış tıbbi transkripsiyon metnini doğrudan BigQuery içinde yapılandırılmış, sorgulanabilir klinik verilere nasıl dönüştürebileceğini gösteriyor. Ham tıbbi notları seçer ve hasta yaşını, kan basıncını (sistolik ve diyastolik), kilosunu, tıbbi durumlarını, tanılarını ve reçete edilen ilaçları çıkarmak için tanımlanmış bir şema ile AI.GENERATE_TABLE kullanır. Fonksiyon, sıkı veri türlerini (örneğin, INT64, FLOAT64, ARRAY) zorunlu kılarak, özel NLP işlem hatları kurmaya gerek kalmadan çıktının temiz ve standartlaştırılmış olmasını sağlar. Böylece elde edilen çıktı analiz, raporlama veya toplum sağlığı içgörülerine anında hazır olur.


SELECT
  age,
  blood_pressure,
  weight,
  conditions,
  diagnosis,
  medications,
  prompt
FROM
  AI.GENERATE_TABLE(MODEL bqml_tutorial.gemini25flash,
    (
    SELECT
      input_text AS prompt
    FROM
      bqml_tutorial.kaggle_medical_transcriptions
    LIMIT
      3),
    STRUCT(
      "age INT64, blood_pressure STRUCT<high INT64, low INT64>, weight FLOAT64, conditions ARRAY<STRING>, diagnosis ARRAY<STRING>, medications ARRAY<STRING>" AS output_schema,
      1024 AS max_output_tokens))

Yapay Zeka Tarafından Üretilen Yapılandırılmamış Verileri BigQuery Tablosuna Dönüştürme

3. AI.CLASSIFY


Otomatik Kategorizasyon

Genel bir LLM’den de bir şeyi “kategorize etmesini” isteyebilirsiniz. Fakat AI.CLASSIFY, girdileri tanımlanmış bir etiket kümesiyle eşleştirmek üzere optimize edilmiştir.


Temel Yetenekler

Bir kategori listesi (örneğin, [‘acil’, ‘rutin’, ‘spam’]) veya açıklamaları içeren bir JSON haritası sağlarsınız ve fonksiyon en uygun olanı döndürür. Sınıflandırma kalitesini artırmak için girdiyi otomatik olarak yapılandırır.


Kullanım Örneği: Otomatik Haber Kategorizasyonunu Ölçeklendirme

Bu sorgu, bir medya kuruluşunun büyük hacimli haber makalelerini doğrudan BigQuery içinde nasıl otomatik olarak sınıflandırabileceğini gösteriyor. AI.CLASSIFY kullanılarak her makale gövdesi, teknoloji, spor, iş, siyaset veya eğlence gibi önceden tanımlanmış kategorilerden birine atanır. Daha sonra sonuçlar her kategoriye kaç makalenin düştüğünü saymak için birleştirilir. Böylelikle ayrı makine öğrenmesi modelleri oluşturmadan veya verileri veri ambarı dışına aktarmadan gerçek zamanlı içerik etiketleme, editoryal analiz ve trend izleme mümkün hale gelir.


SELECT
  AI.CLASSIFY(
    body, 
    categories => ['tech', 'sport', 'business', 'politics', 'entertainment'],
    connection_id => 'us.test_connection') AS category,
  COUNT(*) num_articles
FROM bigquery-public-data.bbc_news.fulltext
GROUP BY category;

4. AI.EMBED ve ML.GENERATE_EMBEDDING


Semantik Aramanın Temeli

Bu fonksiyonlar metin, görüntü veya videoları, anlamı temsil eden sayısal vektörler olan “yerleştirmelere” (embeddings) dönüştürür.


Temel Yetenekler

Veriler yerleştirildikten sonra, öğeleri sadece anahtar kelimelerle eşleştirmek yerine “en yakın eşleşmeleri” bulmak için matematiksel olarak karşılaştırabilirsiniz. AI.EMBED, yerleştirmeler oluşturmak için daha yeni ve basitleştirilmiş bir söz dizimidir. ML.GENERATE_EMBEDDING ise Temel Bileşen Analizi (PCA) ve Matris Faktörizasyonu gibi görevler için detaylı kontroller sunar.


Kullanım Örneği: Akıllı Arama ve Getirme için Semantik Yerleştirmeler Oluşturma

Bu sorgu, bir medya kuruluşunun AI.EMBED kullanarak doğrudan BigQuery içindeki haber makaleleri için nasıl vektör yerleştirmeleri oluşturabileceğini gösteriyor. Her makale için gövde metni, belirtilen yerleştirme modeli kullanılarak yüksek boyutlu bir sayısal temsile dönüştürülür. Bu yerleştirmeler daha sonra anlamsal arama, benzerlik eşleştirme, öneri sistemleri ve kümelemeyi destekleyebilir. Bu sayede, verileri harici bir vektör işleme sistemine aktarmadan daha akıllı içerik keşfi ve kişiselleştirme yapılabilir.


SELECT
 title,
 body,
 AI.EMBED(
   body,
   endpoint => "text-embedding-005"
 ).result
FROM
 `bigquery-public-data.bbc_news.fulltext`
LIMIT 3;

Daha İyi Veri Analizi İçin Yeni BigQuery Üretken Yapay Zeka Fonksiyonları

5. AI.SIMILARITY


Semantik Arama Artık Çok Basit

Bu skaler fonksiyon, iki girdi arasındaki (metin ve metin veya metin ve görüntü) anlamsal benzerlik puanını hesaplar.


Temel Yetenekler

Yerleştirme oluşturma ve kosinüs benzerliği hesaplama işlemlerini tek bir adımda gerçekleştirir. Geçici (ad hoc) analizler için vektörleri önceden hesaplama ihtiyacını ortadan kaldırır.


Kullanım Örneği: İlgili Haber Makaleleri için Anlamsal Arama

Bu sorgu, bir medya veya finansal analiz ekibinin doğrudan BigQuery içinde anlamsal aramayı nasıl gerçekleştirebileceğini gösteriyor. AI.SIMILARITY kullanarak, “konut piyasasındaki düşüş eğilimleri” şeklindeki doğal dil sorgusunu, metin yerleştirmelerinden yararlanarak her haber makalesinin gövdesiyle karşılaştırır. Anahtar kelime eşleştirmek yerine semantik anlama dayalı bir benzerlik puanı hesaplar, makaleleri buna göre sıralar ve en fazla ilgili olan ilk beş sonucu döndürür. Böylelikle harici bir vektör veritabanı kurmadan bağlama duyarlı içerik getirme, trend takibi ve akıllı araştırma iş akışları mümkün olur.


SELECT
 "housing market downward trends" AS query,
 title AS bbc_news_title,
 body AS bbc_news_body,
 AI.SIMILARITY(
   "housing market downward trends", body, endpoint => "text-embedding-005")
   AS similarity_score
FROM `bigquery-public-data.bbc_news.fulltext`
ORDER BY similarity_score DESC
LIMIT 5;


Özet Tablo – BigQuery Üretken Yapay Zeka Fonksiyonları ve Özellikleri


Fonksiyon Fonksiyon Türü Temel Kullanım Örneği Çıktı Formatı
AI.GENERATE Skaler Fonksiyon (Satır başına tek bir değer/yapı döndürür.) Genel amaçlı çok modlu üretim, özetleme, çeviri ve geçici analizler Serbest formatlı metin (STRING) veya bir output_schema sağlanmışsa yapılandırılmış JSON (STRUCT)
ML.GENERATE_TEXT Tahmin Fonksiyonu (Girdi tablosuna sütunlar ekler.) Derin parametre kontrollü gelişmiş model çıkarımı veya Gemini dışı üçüncü parti ya da açık modellerin kullanımı. Modelin tam yanıtını içeren JSON payload veya girdiye eklenen düzleştirilmiş metin sütunları
AI.GENERATE_TABLE Tablo Değerli Fonksiyon (TVF) (Tam bir tablo döndürür.) Yapay zeka destekli ETL; düzensiz ve yapılandırılmamış verileri sıkı veritabanı satır ve sütunlarına dönüştürme Kullanıcı tanımlı sütunlara ve veri türlerine (örneğin, INT64, STRING, BOOL) sahip sıkı bir BigQuery tablosu
AI.CLASSIFY Skaler Fonksiyon Metin veya görsel verilerin önceden tanımlanmış etiketlere göre otomatik olarak kategorize edilmesi STRING (Girdiye en uygun kategori adı)
AI.EMBED Skaler Fonksiyon Semantik arama oluşturmak için sayısal vektörlerin (yerleştirmelerin) basitleştirilmiş üretimi Vektör Dizisi (Sayısal vektör)
ML.GENERATE_EMBEDDING Tahmin Fonksiyonu (Girdi tablosuna sütunlar ekler.) Sağlam yerleştirme üretimi ve gelişmiş matematiksel temsil (PCA, Autoencoders, Matrix Factorization) Girdiye eklenen ARRAY<FLOAT64> (Üretilen yerleştirmeler)
AI.SIMILARITY Skaler Fonksiyon Geçici (ad-hoc) semantik arama; kavramsal olarak ilgili öğeleri bulma FLOAT (Kosinüs benzerliği puanı)

Gemini’den Açık Kaynağa Desteklenen Modeller

BigQuery artık çok çeşitli modelleri destekleyerek size maliyet ve performans arasında doğru dengeyi kurma esnekliği sunuyor.


  1. Google Modelleri: Gemini ailesi (Gemini 3.1 Pro/Flash dahil) ve Vertex AI metin/çok modlu yerleştirme modelleri için tam destek sunar.
  2. İş Ortağı Modelleri: Anthropic Claude, Mistral ve Meta Llama gibi Google tarafından yönetilen iş ortağı modellerini kullanarak doğrudan SQL üzerinden çıkarım yapabilirsiniz.
  3. Açık Modeller: Hugging Face ve Vertex AI Model Garden aracılığıyla, gemma-3-1b-it gibi açık modelleri aşağıda gösterildiği gibi basit bir CREATE MODEL ifadesiyle dağıtabilirsiniz. BigQuery gerekli hesaplama kaynaklarını otomatik olarak hazırlar ve temizleme dahil yaşam döngüsü yönetimini gerçekleştirir.

CREATE OR REPLACE MODEL my_dataset.managed_text_model
REMOTE WITH CONNECTION DEFAULT
OPTIONS (
  model_garden_model_name = 'publishers/google/models/gemma3@gemma-3-1b-it'
);


BigQuery Üretken Yapay Zekanın Gerçek Dünyadan Kullanım Örnekleri

Yapılandırılmış iş verilerini yapılandırılmamış yapay zeka işlemeyle birleştirme yeteneği, sektörler genelinde pek çok yeni fırsat ortaya çıkarmaktadır.


  • Perakende ve E-Ticaret: SEO için ürün görsellerini metin açıklamalarına dönüştürün, müşteri incelemelerini duyguya göre sınıflandırın veya yerleştirmeleri kullanarak görsel arama araçları oluşturun.
  • Sağlık: Tanımlanmış bir çıktı şemasıyla AI.GENERATE kullanarak yapılandırılmamış doktor notlarından veya giriş formlarından yapılandırılmış hasta verilerini (örneğin yaş, semptomlar, ilaç) çıkarın.
  • Finans: Anomali tespiti yapmak veya dolandırıcılığa işaret edebilecek kavramsal olarak benzer işlem açıklamalarını bulmak için AI.SIMILARITY kullanın.
  • Medya ve Yayıncılık: İçerik etiketlemeyi otomatikleştirin, makaleleri farklı dillere çevirin ve milyonlarca arşivlenmiş belge için başlık veya özet oluşturun.

Güvenlik ve Kimlik Yönetimi

Yapay zekanın veritabanına entegre edilmesi haklı güvenlik sorularını gündeme getirir. Google Cloud, yönetişime ve kullanım kolaylığına odaklanarak bunu basitleştirdi.


  • Son Kullanıcı Kimlik Bilgileri (EUC): Eskiden karmaşık hizmet hesabı anahtarlarını yönetmeniz gerekiyordu. Artık BigQuery, Vertex AI isteklerini kişisel IAM kimliğinizi (Son Kullanıcı Kimlik Bilgileri) kullanarak doğrulayabiliyor. Hesabınız “Vertex AI Kullanıcısı” rolüne sahipse bu sorguları ara bağlantılar kurmadan hemen çalıştırabilirsiniz.
  • Bütünleşik Yönetişim: İş akışı BigQuery içerisinde gerçekleştiği için mevcut veri yönetişimi politikalarınız geçerli olmaya devam eder. Verilerin işlenmek için güvenli olmayan ortamlara aktarılması gerekmez.
  • Güvenlik Filtreleri: ML.GENERATE_TEXT ve AI.GENERATE_TABLE gibi fonksiyonlar nefret söylemi, taciz ve tehlikeli içerikler için eşikler belirlemenize olanak tanıyan safety_settings parametresini destekler. Model, bu güvenlik standartlarını ihlal eden yanıtları filtreleyecektir.
  • Kaynak Yönetimi: BigQuery, açık modellerin arka plandaki kaynak hesaplamasını otomatik olarak yönetir. Uç nokta, önceden belirtilmiş bir süre boyunca boşta kaldığında kaynakları serbest bırakır ve maliyetleri durdurur.

⭐⭐⭐


BigQuery’deki en son yapay zeka ve makine öğrenmesi fonksiyonları, gerçekten SQL tabanlı yapay zekaya doğru önemli bir evrimi işaret ediyor. Kurumlar, modelleri doğrudan veriye getirerek ekiplerinin halihazırda güvendiği tanıdık SQL ortamından ayrılmadan denemeleri hızlandırabilir, mimari yükü azaltabilir ve yapılandırılmamış verilerden içgörüler çıkarmaya başlayabilir.


Bu yaklaşım sadece uygulamayı basitleştirmekle kalmaz; veriden değere giden yolu temelden kısaltır. BigQuery veri setlerini zenginleştirme, iş akışlarını otomatikleştirme ve akıllı analizler oluşturmada yaptığı atılımlarla, hızla hem veri hem de yapay zeka için bütünleşik bir platform haline geliyor.


Bir sonraki adımı atmaya hazır mısınız? BigQuery’nin genel veri setlerini kullanarak yapay zeka fonksiyonlarını hemen keşfetmeye başlayın ve ham verilerden ne kadar hızlı eyleme dönüştürülebilir zeka elde edebileceğinizi görün.


Etkinizi ölçeklendirmeye hazır mısınız? Google Cloud’da yapay zeka destekli veri çözümlerinizi tasarlamak, dağıtmak ve ölçeklendirmek için bizimle iletişime geçin.


Yazan: Umniyah Abbood

Yayınlanma Tarihi: 02.04.2026



Kategoriler

Tümü Açık Kaynak (27) Android Anthos Çekirdekten Yetişenler Çevik Metodoloji Çocuklar ve Teknoloji (2) Ödeme Sistemleri (2) Üretim Sektörü (5) B2B Pazarlama (5) Bamboo Büyük Ölçekli Şirketler (4) BT Bulut (159) Buluta Geçiş (19) Bulutta Yerel Yazılım Geliştirme (4) C++ Chef ClickHouse Dayanıklılık DevOps (13) Dijital Pazarlama (12) Dijital Yerli Firmalar (3) Django (2) E-ticaret (8) Enerji Sektörü Eğitim Sektörü (8) Felaket Kurtarma (2) Finansal Hizmetler (4) FinOps (3) Firebase (10) Flutter Gayrimenkul Sektörü Güvenlik (15) Git Golang (2) Google Cloud (114) Google Labs (14) Google Maps (2) Google Workspace (29) Helm Hibrit ve Çoklu Bulut (8) JavaScript Kadınlar ve STEM (3) Kamu Sektörü (2) KOBİ (5) Kubernetes (5) Kullandığımız Teknolojiler (24) Kullanıcı Arayüzü ve Kullanıcı Deneyimi Linux (6) Looker (7) MariaDB Mobil Uygulama Geliştirme (2) MySQL OpenStack (4) Oyun Sektörü (15) Perakende (14) PostgreSQL Proje Metodolojileri Python (7) Sadakat Programı (5) Sağlık ve Yaşam Bilimleri Sektörü (3) Sürdürülebilirlik (6) Sektöre Özgü Bulut Çözümleri (41) Selenium (2) Sigorta Sektörü Sistem Mimarisi (7) Tüketici Ürünleri (2) Tedarik Zinciri ve Lojistik (4) Teknoloji, Medya, Telekom (3) Terraform Test Etme (4) Turizm ve Eğlence (6) Ulaşım Sektörü (2) Uygulama Modernizasyonu Veri Analitiği (39) Veri Bilimi (2) Veri Depolama Veri Görselleştirme (7) Veri Tabanı (4) Versiyon Kontrolü Yapay Zeka - Makine Öğrenmesi (154) Yasal Uyum Yazılım Geliştirme (9) Yazılım Tarihi (3) Yazılımcı Deneyimi (8) İK Uygulamaları (10) İnşaat Sektörü İşe Alım (7)
Daha Fazla Kategori Göster >> Kategorileri Gizle >>

Kartaca sitesinden daha fazla şey keşfedin

Okumaya devam etmek ve tüm arşive erişim kazanmak için hemen abone olun.

Okumaya Devam Edin