Kullanım Senaryosu: Google Cloud Document AI ile Belge İşleme Süreçlerini Otomatikleştirme

İşletmeler, karar alma süreçlerinde her gün büyük miktarda yapılandırılmamış veriyle karşı karşıya kalıyor. Taranmış belgeler, formlar, faturalar ve e-postaların manuel olarak işlenmesi, zaman kaybına yol açarken süreci de hatalara açık hale getirmektedir. Bu durum, operasyonel verimliliği düşürür ve analiz süreçlerini yavaşlatır. Bu sorunların önüne geçmede çok etkili olan Google Cloud Document AI API, yapılandırılmamış verilerden otomatik olarak değerli bilgiler çıkarmayı, bu verileri analiz etmeyi ve saklamayı mümkün kılan akıllı bir belge işleme çözümüdür.
Manuel Süreçlerin Getirdiği Sorunlar
Bir şirket, her gün müşteri kabul formları ve satın alma talepleri gibi binlerce belgeyi işlemektedir. Bu belgelerdeki adres bilgileri, pazar analizi ve lojistik planlama açısından kritik bir öneme sahipti. Ancak belge inceleme süreci yoğun manuel efor gerektirdiği için verilerin erişilme ve analiz edilme hızı sınırlıydı. Şirket, bu süreçleri otomatikleştirerek yapılandırılmamış verilerden anlamlı bilgileri çıkarmak, çıkarılan verileri coğrafi bilgilerle zenginleştirmek ve bu verileri analiz ve raporlama için organize etmek için bir çözüm arıyordu.
Bu yazıda, bu şirketin Google Cloud Document AI API, Cloud Storage, Cloud Run, BigQuery, Pub/Sub ve Geocoding API’yi kullanarak nasıl otomatik ve ölçeklenebilir bir belge işleme akışı oluşturabileceğini inceleyeceğiz.
Google Cloud Document AI ile Otomatik ve Ölçeklenebilir Belge İşleme Akışı
Şirketin Google Cloud Document AI API’yi kullanarak oluşturduğu otomatik belge işleme akışı, aşağıdaki adımlardan oluşmaktadır:
- Cloud Storage’a Yükleme: Belgeler, belirlenen bir Cloud Storage bucket’a yüklendiğinde belge işleme süreci otomatik olarak başlar. Cloud Storage, farklı format ve boyutlardaki dosyaları işlemek için esnek bir çözüm sunar.
- Document AI ile Otomatik Veri Çıkarma: Belgeler yüklendiğinde, Document AI API’sini çağıran bir Cloud Run fonksiyonu tetiklenir. Document AI; belgeyi işler, isim verir, adres gibi yapılandırılmış verileri çıkarır ve bunları JSON formatında döndürür. API’nin form işlemcisi, “Adres” etiketli alanları, her belge türü için belirli etiketleri önceden tanımlamaya gerek kalmadan algılayabilir.
- BigQuery’de Veri Depolama: Yapılandırılmış veriler, Google Cloud’un tamamen yönetimli veri ambarı olan BigQuery’de saklanır ve verilere raporlama ve analiz için anlık olarak erişilebir. BigQuery, çıkarılan verilerin verimli bir şekilde sorgulanmasına olanak tanır ve kurum genelinde veriye dayalı içgörüler sağlar.
- Adres İşleme ve Zenginleştirme: Çıkarılan veriler adres alanları içeriyorsa, Cloud Run fonksiyonu bu verilerle Pub/Sub topic‘e bir mesaj yayınlar. Bu mesaj, adresi coğrafi koordinatlara (enlem ve boylam) dönüştüren Geocoding API’yi çağıran ikinci bir Cloud Run fonksiyonunu tetikler. Zenginleştirilmiş veriler daha sonra BigQuery’ye yazılarak konum bilgisi gerektiren uygulamalar için veri setini zenginleştirmekte kullanılır.
Temel Mimari Bileşenler
- Document AI API: Yapılandırılmamış verileri işler ve yapılandırılmış alanları ayıklayarak faturalar ve satın alma emirleri gibi karmaşık belgelerin analizini kolaylaştırır. API’nin özel ayrıştırıcıları (fatura ayrıştırıcısı gibi), yapı ve düzen açısından önemli ölçüde farklılık gösteren belge formatlarını işlemek için gelişmiş özellikler sunar.
- Cloud Storage: Bir belge yüklendiğinde ilk Cloud Run fonksiyonunu tetikleyerek hattın başlangıç noktası olarak hizmet eder.
- Cloud Run: Belge işlemek ve adres verilerini Pub/Sub’a göndermek için gereken fonksiyonları yürüten sunucusuz bir platformdur. Bu nedenle, hesaplama kaynaklarını gerçek zamanlı olarak yönetmek için hafif ve verimli bir araçtır.
- BigQuery: Çıkarılan ve zenginleştirilen veriler için merkezi depolama alanı sunarak, ekiplere hızlı analiz, pano oluşturma ve raporlama imkanı sağlar.
- Pub/Sub: Cloud Run fonksiyonları arasındaki veri akışını koordine eder, adres verilerinin varlığı gibi olaya dayalı işlemleri tetikleyerek çok adımlı iş akışlarını etkinleştirir.
- Geocoding API: Coğrafi koordinatlar ekleyerek verileri zenginleştirir ve konuma dayalı hassas analizlere olanak tanır.
Kazanımlar
Google Cloud Document AI ve diğer destekleyici servisler, şirketin belge yönetim süreçlerinde çok büyük bir dönüşüm yarattı. Otomasyon sayesinde hem operasyonel maliyetler azaldı, hem de veriye dayalı karar verme süreçleri hızlandı. Şirket, bu yeni sistemle rekabet avantajını artırarak geleceği için daha sağlam bir temel oluşturdu.
Başlıca kazanımlar şunlardır:
- Daha Hızlı Veri İşleme ve Manuel Eforun Azalması: Otomatik veri çıkarma ve zenginleştirme ile şirket, manuel belge incelemesini en aza indirerek ekiplerin katma değeri daha yüksek olan görevlere odaklanmasını sağladı.
- Veri Doğruluğunun Artması: Otomatik veri çıkarma, manuel veri girişine bağlı hataları azaltarak verileri daha temiz ve güvenilir hale getirdi.
- Gerçek Zamanlı İçgörüler: Şirket, çıkarılan verileri BigQuery’de merkezileştirerek, bilgilere gerçek zamanlı olarak erişebilir ve analiz edebilir hale geldi. Böylelikle daha hızlı karar verebilmeye başladı.
- Ölçeklenebilirlik: Çözüm, değişen belge hacimlerini sorunsuz bir şekilde işleyebildi ve Cloud Run’ın sunucusuz yapısı, sistemin gerektiğinde ölçeklenmesine olanak tanıdı.
Yazan: Umniyah Abbood
Yayınlanma Tarihi: 10.12.2024
