Müşterilerimiz İletişim EN

Google Whisk: Görüntü Tabanlı Yapay Zeka ile Fikirleri Görselleştirme ve Düzenleme



Google, hızla gelişen yapay zeka teknolojileriyle sanat üretimine yönelik deneysel aracı Google Whisk’i tanıttı. Geleneksel yapay zeka araçları genellikle metin istemleri üzerinden görseller üretirken, Whisk, bu yaklaşımı tersine çevirerek kullanıcıların başka bir görseli ana kaynak olarak kullanıp yeni görseller üretmesine olanak tanıyor. Bu görsel odaklı yaklaşım, sıradışı ve yaratıcı bir bakış açısı sunmakla kalmıyor, aynı zamanda görsellerin başka görselleri şekillendirdiği sezgisel bir yaratıcılık dünyasının kapılarını açıyor.




Google Whisk Nasıl Çalışır?

Whisk, basit ama güçlü bir konsepte dayanır: Vizyonunuzu kelimelerle anlatmak yerine, aklınızdaki konu, sahne ve stili temsil eden üç görsel yüklersiniz. Kullanıcı dostu sürükle-bırak arayüzü sayesinde, Whisk bu yaratıcı temelleri görsel olarak tanımlamanıza imkan verir. Örneğin, suluboya dokulu bir sürreal manzarada belirli bir karakter veya bilim kurgu şehrinde fotogerçekçi bir portre gibi isteklerinizi, karmaşık bir istem yazmanıza gerek kalmadan oluşturur.


Ayrıca tıkandığınızı hissettiğinizde, Whisk’in “İlham Ver” (Inspire Me) ve “Zar At” (Roll the Dice) özellikleri, hayal gücünüzü harekete geçirmek için rastgele görsel önerileri sunar. Böylece yaratım süreci bir angarya olmaktan çıkar, keyifli bir oyuna dönüşür.


Gemini ve Imagen 3 Desteğiyle Hassasiyet ve Yaratıcılık Buluşuyor

Whisk’i gerçekten farklı kılan şey, arka planda olanlardır. Görsellerinizi seçtikten sonra Whisk, Google’ın en gelişmiş çok modlu yapay zeka modellerinden biri olan Google Gemini’nin gücünden yararlanarak görsel içeriği analiz eder. Gemini, görselleri çözümler ve her bir girdinin “özünü” yakalayan ayrıntılı metin açıklamaları üretir. Bu süreç, “öz yakalama” (essence capture) olarak bilinir ve Whisk’in görselleri sadece birleştirmek ya da stilleri birebir kopyalamakla sınırlı kalmasını engeller. Bunun yerine, temel görsel özellikleri anlayarak, onları yaratıcı bir şekilde yeniden tasarlamasını sağlar.


Bu açıklamalar daha sonra Google’ın son teknoloji görsel üretim modeli olan Imagen 3’e aktarılır. Imagen 3, Gemini tarafından oluşturulan planı kullanarak, konu, sahne ve stili harmanlayarak tamamen yeni bir görsel oluşturur. Ortaya çıkan görseller, geliştirilmiş parlaklık, rafine kompozisyonlar ve fotogerçekçilikten animeye, soyut sanata kadar son derece doğru sanatsal tasvirlerle etkileyici sonuçlar verir.


Bu işleyişin harikalığı şudur: Whisk’in oluşturduğu son istemi alıp doğrudan Imagen 3 üzerinden çalıştırırsanız, çok benzer bir görsel elde edersiniz. Neden mi? Çünkü Whisk, Imagen 3 üzerine inşa edilmiştir. Fark şu ki; Whisk tüm ağır işi sizin yerinize yapar ve sizi aşırı detaylı metin tabanlı istemler yazma zahmetinden kurtarır. Bunun yerine, zahmetsizce düzenleyebileceğiniz optimize edilmiş bir istem elde edersiniz. Yani, yaratıcı niyetini metinden görsele yapay zeka modellerine aktarmakta zorlanan herkes için gerçek bir rüya gerçekleşmiş olur.


Gerçek Uygulamalar: Whisk Tarafından Oluşturulan İstemlerle Karmaşık Açıklamalar Basitleşiyor


Alacakaranlıkta Zarafet: Okyanus Kenarında Klasik Bir Yolculuk

Modada Yapay Zekanın Yükselişi: Imagen 3 ve Veo 2 İncelemesi başlıklı blog yazımızda Imagen 3 ile ürettiğimiz bir görseli ‘konu’ olarak, Imagen 3 ile Sosyal Medya Kampanyalarınızı Yeniden Şekillendirin başlıklı blog yazımızda yine Imagen 3 ile ürettiğimiz bir görseli ‘sahne’ olarak yükledik ve stili boş bıraktık.



Whisk tarafından oluşturulan istem: Açık tenli genç bir kadın, gün batımında okyanusa bakan bir yolda park etmiş turkuaz renkli klasik bir iki kapılı otomobilin yanında duruyor. Üzerinde kısa kabarık kollu, yakalı, pileli etekli ve küçük taşlı tokaya sahip açık pembe kemerli bir elbise var. Elbisenin üst kısmı pembe, yeşil ve bej renklerde nakışlı çiçek detaylarıyla süslenmiş. Araba profilden sağa dönük şekilde konumlandırılmış, beyaz yanaklı lastiklere ve krom jant kapaklarına sahip. Okyanus sakin, koyu mavi-gri tonlarında ve uzakta alçak kıyı şeridi ile açık kahverengi bir uçurum görünüyor. Gün batımı gökyüzü turuncu, sarı ve mor tonların karışımıyla, ince bulutlarla kaplı. Kadın, hafifçe arabaya doğru açı yaparak izleyiciye dönük duruyor.


Whisk ile üretilen görsel

Whisk tarafından oluşturulan orijinal istemi Imagen 3’e eklediğimizde ortaya çıkan sonuç aşağıdaki gibi oldu. Bu da Whisk’in arka planda Imagen 3’ü kullandığını açıkça gösteriyor.


Imagen 3 ile üretilen görsel

Simyacının Sırrı: Gizemli Bir Çıkartma Tasarımı

Imagen 3 ile Oyun Tasarımında Yeni Bir Dönem başlıklı blog yazımız için oluşturmuş olduğumuz görsellerden birini yükledik. Konu olarak ‘oyun’ seçtik, stil olarak ‘çıkartma’ tercih ettik ve sahneyi boş bıraktık.


Whisk ile üretilen görsel

Whisk tarafından oluşturulan istem: Bir çıkartma tasarımı: Açık tenli ve derin çizgili yüzü olan karikatür tarzında yaşlı bir adam, kalın siyah çizgilerle belirginleştirilmiş koyu yeşil kapüşonlu bir pelerin giyiyor ve içinde parlayan kırmızı sıvı bulunan yuvarlak cam bir şişe tutuyor. Şişenin ağzı mantarla kapatılmış. Koyu renkli ve parlak sarı gözlü bir kuzgun, adamın omzuna tünemiş. Pelerinin altından, küçük metal tokalarla tutturulmuş açık renkli uzun kollu bir tunik görünüyor. Adamın belinde büyük metal tokalı kahverengi deri bir kemer var. Pelerinin kenarları hafifçe yıpranmış. Parlak, doygun renkler. Basit, eğlenceli bir stil. Kalın siyah çizgiler. Beyaz arka plan. Adamın yüzü ve elleri parlak vurgularla öne çıkarılmış. Kuzgunun tüyleri keskin ve zıt çizgilerle detaylandırılmış. Şişedeki kırmızı sıvı parlak, neredeyse neon etkili bir şekilde ışıldıyor. Genel stil, bir su şişesindeki çıkartmayı andırıyor.


‘Refine Prompt’ seçeneğine tıklayıp kapüşonlu pelerinin rengini koyu yeşilden koyu maviye değiştirdiğimizde, Whisk şunu oluşturdu:


Whisk ile üretilen görsel

Whisk tarafından oluşturulan orijinal istemi Imagen 3’e eklediğimizde ortaya çıkan sonuç aşağıdaki gibi oldu. Bu da Whisk’in arka planda Imagen 3’ü kullandığını açıkça gösteriyor.


Imagen 3 ile üretilen görsel

Emaye Rozet Stilinde Noel Sahnesi

Imagen 3 ile Sosyal Medya Kampanyalarınızı Yeniden Şekillendirin başlıklı blog yazımız için Imagen 3 ile oluşturmuş olduğumuz görsellerden birini yükledik. Konu olarak ‘pazarlama’ seçtik, stil olarak ’emaye rozet’ tercih ettik ve sahneyi boş bıraktık.


Whisk ile üretilen görsel

Whisk tarafından oluşturulan istem: Kırmızı ve altın süslemelerle, beyaz ışıklarla aydınlatılmış parlak bir Noel ağacını tasvir eden detaylı bir emaye rozet. Altında, kırmızı ve altın tonlarında paketlenmiş birkaç hediye bulunuyor. Sol tarafta, üzerinde herdem yeşil bir çelenk, kırmızı süsler ve yanmakta olan mumlarla dekore edilmiş bir şömine rafı bulunan, alevleri harlayan bir şömine yer alıyor. Şöminenin üstünde bir Noel çelengi asılı. Oda loş bir şekilde aydınlatılmış, sahneyi ateş ve ağaç ışıkları aydınlatıyor. Ahşap kaplı duvarlar ve koyu renkli bir parke zemin görünür durumda. Koyu kahverengi perdelerle çerçevelenmiş bir pencereden, karlı bir gece manzarası gözüküyor. Rozet, altın bir kenarlığa sahip ve sade beyaz bir arka plan üzerinde sunuluyor, kot ceket ya da sırt çantasında bulunabilecek bir rozet tarzında. Tüm unsurlar, keskin hatlar ve canlı renklerle detaylı, emaye rozet benzeri bir tarzda işlenmiş.


Whisk ile üretilen görsel

Heykel Minyatürlü Sevgililer Günü Çikolata Kutusu

Imagen 3 ile Sosyal Medya Kampanyalarınızı Yeniden Şekillendirin başlıklı blog yazımız için Imagen 3 ile oluşturmuş olduğumuz görsellerden birini yükledik. Konu olarak ‘pazarlama’ seçtik, stili ‘Zar At’ (Roll the Dice) özelliğini kullanarak rastgele seçtik ve sahneyi boş bıraktık.


Whisk ile üretilen görsel

Whisk tarafından oluşturulan istem: Sevgililer Günü’ne özel bir çikolata kutusunun yakın plan görüntüsü. Çikolatalar, her biri ayrı bölmelere sahip koyu kahverengi bir plastik tepsiye yerleştirilmiş. Bir çikolata, fırçalanmış paslanmaz çelik bir espresso makinesi şeklinde ve boyanmış, dijital kontrol paneli ve portafiltre grupları gibi küçük, özenle işlenmiş detaylarla tamamlanmış. Başka bir çikolata ise, açık kahverengi ahşap bir kapağa sahip şeffaf cam bir demlik şeklinde ve bir altlık üzerinde duruyor. Üç adet üst üste konmuş beyaz tabak, yine çikolatadan yapılmış, demlik yanında yer alıyor ve üstlerinde birkaç küçük, yuvarlak, açık kahverengi hamur işi çikolata bulunuyor. Çikolatalar hafifçe doygunluğu azaltılmış bir görünüme sahip, renkler yumuşak ve dokuları hafif grenli. Genel ton sıcak ve davetkar. Işık yumuşak ve dağılmış. Çikolatalar, kutu içinde diğer güzel süslenmiş çikolataların arasında sevimli, küçük ve yuvarlak tatlılar olarak ustalıkla şekillendirilmiş. Kompozisyon görsel olarak çekici ve dengeli, sadece bu muhteşem ve renkli kutunun yakın çekimi gösteriliyor.


Whisk tarafından oluşturulan orijinal istemi Imagen 3’e eklediğimizde ortaya çıkan sonuç aşağıdaki gibi oldu. Bu da Whisk’in arka planda Imagen 3’ü kullandığını açıkça gösteriyor.


Whisk ile üretilen görsel

Imagen 3 ile üretilen görsel

Dijital Sanattan Pazarlamaya: Whisk’in Yaratıcılığı Dönüştüren Gücü

Whisk, yalnızca yaratıcılık açısından eğlenceli bir araç değil. Aynı zamanda birçok sektördeki potansiyel uygulama alanlarıyla bir ezber bozan.

  • Dijital sanatçılar, ileri düzey istem mühendisliği bilgisine ihtiyaç duymadan, görsel stilleri ve kompozisyonları hızlıca yineleyebilir.
  • Pazarlamacılar, belirli temalara veya estetik anlayışlara özel kampanya görselleri üretebilir ve yaratıcı yönetim üzerinde benzersiz bir kontrol sağlayabilir.
  • İçerik üreticileri, mevcut fikirleri yeniden harmanlayabilir. Storyboard ve mood board geliştirme süreçlerini her zamankinden daha hızlı tamamlayabilir.

Whisk, kullanıcıların metin tabanlı istemler yazmak yerine görselleri “remix” yapmasına olanak tanıyarak görsel yaratım sürecini demokratikleştiriyor. İlhamla çıktı arasındaki sınırları bulanıklaştırıyor ve yapay zeka destekli üretimi daha sezgisel, daha erişilebilir kılıyor.


Whisk ile Görsel Yapay Zekada Yeni Bir Dönem

Google Whisk’in Gemini ve Imagen 3 ile entegrasyonu, yapay zekanın geleceğine güçlü bir pencere açıyor. Bu gelecekte, çok modlu yapay zeka yalnızca yazdıklarımızı değil, gördüklerimizi de anlayabiliyor. Görsellerin özünü yakalayıp bunları yeni ve uyumlu görsellere dönüştürmesi, üretken yapay zekanın geldiği noktayı net biçimde gösteriyor.


Yapay zekayla sanat üretirken “mükemmel” istemi yazmakta zorlanan herkes için Whisk adeta ferahlatıcı bir çözüm. Yaratıcı süreci baştan tanımlıyor; size en çok ilham veren şeyle, yani görsellerle başlamanızı sağlıyor. Üstelik bu görselleri zahmetsizce iyileştirmeniz, düzenlemeniz ve yeniden hayal etmeniz için gereken tüm araçları sunuyor.


Sanatçı, pazarlamacı ya da sadece yaratıcı bir zihin olun fark etmez. Google Whisk, görsel odaklı ve daha doğal bir yaratıcılığa atılmış heyecan verici bir adım. En güzel tarafıysa şu: Artık istem mühendisliğinde uzman olmanıza gerek yok. Sadece yükleyin, düzenleyin, oluşturun.


Fikirlerinizi şimdiye kadar hiç yapmadığınız şekilde görselleştirmeye hazır mısınız? O zaman hemen bize ulaşın.


Yazan: Umniyah Abbood

Yayınlanma Tarihi: 29.04.2025



Kategoriler

Tümü Açık Kaynak (27) Android Anthos Çekirdekten Yetişenler Çevik Metodoloji Çocuklar ve Teknoloji (2) Ödeme Sistemleri (2) Üretim Sektörü (5) B2B Pazarlama (5) Bamboo Büyük Ölçekli Şirketler (4) BT Bulut (159) Buluta Geçiş (19) Bulutta Yerel Yazılım Geliştirme (4) C++ Chef ClickHouse Dayanıklılık DevOps (13) Dijital Pazarlama (12) Dijital Yerli Firmalar (3) Django (2) E-ticaret (8) Enerji Sektörü Eğitim Sektörü (8) Felaket Kurtarma (2) Finansal Hizmetler (4) FinOps (3) Firebase (10) Flutter Gayrimenkul Sektörü Güvenlik (15) Git Golang (2) Google Cloud (113) Google Labs (14) Google Maps (2) Google Workspace (29) Helm Hibrit ve Çoklu Bulut (8) JavaScript Kadınlar ve STEM (3) Kamu Sektörü (2) KOBİ (5) Kubernetes (5) Kullandığımız Teknolojiler (24) Kullanıcı Arayüzü ve Kullanıcı Deneyimi Linux (6) Looker (7) MariaDB Mobil Uygulama Geliştirme (2) MySQL OpenStack (4) Oyun Sektörü (15) Perakende (14) PostgreSQL Proje Metodolojileri Python (7) Sadakat Programı (5) Sağlık ve Yaşam Bilimleri Sektörü (3) Sürdürülebilirlik (6) Sektöre Özgü Bulut Çözümleri (41) Selenium (2) Sigorta Sektörü Sistem Mimarisi (7) Tüketici Ürünleri (2) Tedarik Zinciri ve Lojistik (4) Teknoloji, Medya, Telekom (3) Terraform Test Etme (4) Turizm ve Eğlence (6) Ulaşım Sektörü (2) Uygulama Modernizasyonu Veri Analitiği (38) Veri Bilimi (2) Veri Depolama Veri Görselleştirme (7) Veri Tabanı (4) Versiyon Kontrolü Yapay Zeka - Makine Öğrenmesi (153) Yasal Uyum Yazılım Geliştirme (9) Yazılım Tarihi (3) Yazılımcı Deneyimi (8) İK Uygulamaları (10) İnşaat Sektörü İşe Alım (7)
Daha Fazla Kategori Göster >> Kategorileri Gizle >>

Kartaca sitesinden daha fazla şey keşfedin

Okumaya devam etmek ve tüm arşive erişim kazanmak için hemen abone olun.

Okumaya Devam Edin