1. Genel Bakış
Satın alma dokümanı için Document AI nedir?
İşletmeler her yıl binlerce fatura, makbuz ve ilgili diğer dokümanları içeren büyük satın alma süreçleri yönetir. Satın alma yaşam döngünüzün manuel maliyetini azaltmak için pdf, resim ve el yazısı formlar gibi "karanlık verilerinizi" akıllıca işlemek üzere Satın Alma DocAI'yi kullanın. Operasyonel verimliliği artırmak, müşteri deneyimini iyileştirmek ve daha bilinçli kararlar almak için fatura ve makbuz gibi yapılandırılmamış belgeleri yapılandırılmış verilere dönüştürerek büyük ölçekte tedarik verisi yakalamayı otomatikleştirin.
Bu codelab'de Document AI Platform'u nasıl ayarlayacağınızı, örnek bir faturayı nasıl işleyeceğinizi, varlıkları nasıl ayıklayıp AI Platform Notebooks'ta nasıl görselleştireceğinizi öğreneceksiniz.
Neler öğreneceksiniz?
- Document AI Platform'u kullanmaya başlama
- Procurement DocAI çözümünü kullanarak şemaya dönüştürülmüş öğeleri ayıklama
- AI Platform Notebooks örneği oluşturma ve özelleştirme
Gerekenler
Anket
Bu eğitimi nasıl kullanacaksınız?
Python ile ilgili deneyiminizi nasıl değerlendirirsiniz?
Google Cloud hizmetlerini kullanma deneyiminizi nasıl değerlendirirsiniz?
2. Kurulum ve Gereksinimler
Kendine ait tempoda ortam kurulumu
- Cloud Console'da oturum açın ve yeni bir proje oluşturun veya mevcut bir projeyi yeniden kullanın. (Henüz Gmail veya G Suite hesabınız yoksa hesap oluşturmanız gerekir.)
Tüm Google Cloud projeleri genelinde benzersiz bir ad olan proje kimliğini unutmayın. (Yukarıdaki adınız zaten kullanılıyor. Maalesef bu adı kullanamazsınız.) Bu kimliği daha sonra PROJECT_ID
olarak sağlamanız gerekir.
- Ardından, Google Cloud kaynaklarını kullanabilmek için Cloud Console'da faturalandırmayı etkinleştirmeniz gerekir.
"Temizleme" bölümündeki talimatları uygulayın. Bu bölümde, bu eğitimden sonra faturalandırmaya tabi olmamak için kaynakları nasıl kapatacağınız hakkında tavsiyeler verilmektedir. Google Cloud'un yeni kullanıcıları 300 ABD doları değerindeki ücretsiz deneme programına uygundur.
3. Cloud Document AI API'yi etkinleştirme
Document AI'ı kullanmaya başlamadan önce API'yi etkinleştirmeniz gerekir. Tarayıcınızda Cloud Console'u açın.
- Gezinme menüsü ☰ > API'ler ve Hizmetler > Kitaplık'ı tıklayın.
- "Document AI API"yi arayın ve API'yi Google Cloud projenizde kullanmak için Etkinleştir'i tıklayın.
4. İşleyici Oluşturma ve Test Etme
Bu eğitim için Document AI Platform'da kullanmak üzere öncelikle Form Ayrıştırıcı işlemcisinin bir örneğini oluşturmanız gerekir.
- Konsolda Document AI Platformuna Genel Bakış'a gidin.
- İşleyici Oluştur'u tıklayın ve Fatura Ayrıştırıcı'yı seçin
- Bir işlemci adı belirtin ve listeden bölgenizi seçin.
- İşleyicinizi oluşturmak için Oluştur'u tıklayın.
- İşlemci kimliğinizi kopyalayın. Bu değeri daha sonra kodunuzda kullanmanız gerekir.
(İsteğe bağlı) Bir doküman yükleyerek işlemcinizi konsolda test edebilirsiniz. Doküman Yükle'yi tıklayın ve ayrıştırılacak bir form seçin. Kullanabileceğiniz bir formunuz yoksa bu örnek formu indirip kullanabilirsiniz.
Çıkış şu şekilde görünmelidir:
5. AI Platform Notebooks Not Defteri Oluşturma
Cloud Console'unuzun AI Platform Notebooks bölümüne gidin ve Yeni Örnek'i tıklayın. Ardından en son Python örnek türünü seçin:
Varsayılan seçenekleri kullanın ve Oluştur'u tıklayın. Örnek oluşturulduktan sonra JupyterLab'i aç'ı seçin.
6. Örnek kodu alma
Örnek kodu doğrudan Document AI Notebooks GitHub deposundan içe aktarın. Not defterinizde, üst menüden Git > Depo Klonla'ya gidin veya Git simgesini tıklayın:
Aşağıdaki depo URL'sini yapıştırın:
https://github.com/GoogleCloudPlatform/documentai-notebooks.git
Depoyu klonladıktan sonra documentai-notebooks/specialized/ dizinini tıklayın ve specialized_form_parser.ipynb
not defterini açın. GCP projesinin ve Document AI işlemci kimliklerinin tanımlandığı hücreyi bulun.
4. adımdaki GCP proje kimliğinizi ve işlemci kimliğinizi yapıştırın. Not defterinizi kaydedin.
7. Varlıkları Ayıklama ve Görselleştirme
Artık faturalardan şemaya dönüştürülmüş öğeleri ve bunların güven puanlarını ayıklayabilirsiniz. Document yanıt nesnesi, varlıkların listesini içerir. Şemalaştırılmış varlıklar hakkında daha fazla bilgi edinmek için Fatura Ayrıştırıcı hızlı başlangıç kılavuzunu okuyun.
Not defterinizdeki tüm hücreleri çalıştırın ve tablo biçimindeki çıktıya gidin. Önceki kod, her öğeyi iterasyonla tarar ve sonuçları içeren bir Pandas DataFrame oluşturur.
Ardından, aşağı kaydırarak görselleştirme bileşenine gidin. Document nesnesi yanıtı, dokümandaki her sayfanın uzamsal düzen bilgilerini içerir. Aşağıda, her form alanındaki düzen bilgileri, resimde sınır kutuları çizmek için kullanılır. Bu veriler, Document AI'ın bir kullanıcı arabirimi uygulamasına entegrasyonu için kullanılabilir.
8. Tebrikler
Tebrikler, bir faturadan veri ayıklamak için Procurment Document AI çözümünü başarıyla kullandınız. Diğer form türleriyle denemeler yapmanızı öneririz.
Temizleme
Bu eğiticide kullanılan kaynaklar için Google Cloud hesabınızın ücretlendirilmesini istemiyorsanız not defterinizi kapatabilir veya GCP projesini silebilirsiniz.
AI Platform Notebooks örneğini kapatma
AI Platform Notebooks örneğini kapatmak için aşağıdaki talimatları uygulayın.
Projeyi silme
Faturalandırmanın önüne geçmenin en kolay yolu, eğitim için oluşturduğunuz projeyi silmektir.
Projeyi silmek için:
- GCP Console'da Projeler sayfasına gidin. Projeler sayfası
- Proje listesinde, silmek istediğiniz projeyi seçin ve Sil'i tıklayın.
- İletişim kutusuna proje kimliğini yazın ve projeyi silmek için Kapat'ı tıklayın.