Analizuj faktury za pomocą notatników w AI Platform za pomocą narzędzi Procurement Document AI

1. Omówienie

c65b9ae04aa1853.png

Czym jest Procurement Document AI?

Firmy zarządzają dużymi potokami zaopatrzenia, do których zaliczają się tysiące faktur, rachunków i innych powiązanych dokumentów rocznie. Korzystaj z Procurement DocAI, aby inteligentnie przetwarzać „ciemne dane”. takich jak PDF-y, obrazy i odręczne formularze, aby zmniejszyć nakład pracy w cyklu zakupowym. Zautomatyzuj pozyskiwanie danych dotyczących zamówień na dużą skalę, przekształcając nieuporządkowane dokumenty w faktury i rachunki w uporządkowane dane, aby zwiększyć wydajność operacyjną, poprawić wrażenia klientów i podejmować decyzje.

Z tego ćwiczenia w programie dowiesz się, jak skonfigurować Document AI Platform, przetworzyć przykładową fakturę oraz wyodrębnić i wizualizować encje w notatniku AI Platform.

Czego się nauczysz

  • Jak zacząć korzystać z Document AI Platform
  • Wyodrębnianie zwizualizowanych encji przy użyciu rozwiązania Procurement DocAI Solution
  • Tworzenie i dostosowywanie instancji Notatników w AI Platform

Czego potrzebujesz

  • Projekt Google Cloud
  • przeglądarkę, np. Chrome lub Firefox;
  • Wiedza na temat języka Python 3

Ankieta

Jak wykorzystasz ten samouczek?

Tylko do przeczytania Przeczytaj go i wykonaj ćwiczenia

Jak oceniasz swoje doświadczenia z językiem Python?

Początkujący Poziom średnio zaawansowany Biegły

Jak oceniasz korzystanie z usług Google Cloud?

Początkujący Poziom średnio zaawansowany Biegły
.

2. Konfiguracja i wymagania

Samodzielne konfigurowanie środowiska

  1. Zaloguj się w konsoli Google Cloud i utwórz nowy projekt lub wykorzystaj już istniejący. Jeśli nie masz jeszcze konta Gmail lub G Suite, musisz je utworzyć.

Zapamiętaj identyfikator projektu, unikalną nazwę we wszystkich projektach Google Cloud. (Twoja nazwa jest już zajęta i nie będzie Ci odpowiadać). Musisz podać ten identyfikator później jako PROJECT_ID.

  1. Następnie musisz włączyć płatności w Cloud Console, aby korzystać z zasobów Google Cloud.

Postępuj zgodnie z instrukcjami podanymi w sekcji „Czyszczenie” . W tej sekcji znajdziesz informacje na temat wyłączania zasobów, aby nie naliczać opłat po zakończeniu tego samouczka. Nowi użytkownicy Google Cloud mogą skorzystać z programu bezpłatnego okresu próbnego o wartości 300 USD.

3. Włączanie interfejsu Cloud Document AI API

Zanim zaczniesz korzystać z Document AI, musisz włączyć interfejs API. Otwórz konsolę Cloud w przeglądarce.

  1. Kliknij Menu nawigacyjne OK > Interfejsy API Usługi > Biblioteka. Interfejs API wyszukiwarki
  2. Wyszukaj „Document AI API”, a następnie kliknij Włącz, aby używać interfejsu API w projekcie Google Cloud.

4. Utwórz i przetestuj procesor

Musisz najpierw utworzyć instancję procesora parsera formularzy do użycia na platformie Document AI w tym samouczku.

  1. W konsoli przejdź do omówienia Document AI Platform.
  2. Kliknij Utwórz procesor i wybierz Invoice Parser.Procesory
  3. Podaj nazwę procesora i wybierz region z listy.
  4. Kliknij Utwórz, aby utworzyć procesor.
  5. Skopiuj identyfikator podmiotu przetwarzającego. Będzie trzeba użyć go później w kodzie.

(Opcjonalnie) Możesz przetestować procesor w konsoli, przesyłając dokument. Kliknij Prześlij dokument i wybierz formularz do przeanalizowania. Jeśli nie masz jeszcze odpowiedniego formularza, możesz go pobrać i wykorzystać.

Faktura

Dane wyjściowe powinny wyglądać tak: Przeanalizowana faktura

5. Tworzenie notatki w AI Platform

Przejdź do sekcji Notatników AI Platform w konsoli Cloud i kliknij Nowa instancja. Następnie wybierz najnowszy typ instancji Pythona:

a81c82876c6c16f9.png

Użyj opcji domyślnych i kliknij Utwórz. Po utworzeniu instancji wybierz Otwórz JupyterLab.

6. Pobierz przykładowy kod

Bezpośrednio zaimportuj przykładowy kod z repozytorium GitHub w notatnikach Document AI. W notatniku otwórz Git > Sklonuj repozytorium w menu u góry lub kliknij ikonę Git: Git

Wklej ten adres URL repozytorium:

https://github.com/GoogleCloudPlatform/documentai-notebooks.git

Po sklonowaniu repozytorium kliknij katalog documentai-notebooks/specialized/ i otwórz notatnik specialized_form_parser.ipynb. Znajdź komórkę, w której zadeklarowano identyfikatory projektu GCP i procesora Document AI.

zmienne

Wklej identyfikator projektu GCP i identyfikator procesora z kroku 4. Zapisz notatnik.

7. Wyodrębnianie i wizualizowanie encji

Teraz możesz wyodrębnić zwizualizowane encje z faktur i odpowiadające im wskaźniki ufności. Obiekt odpowiedzi Document zawiera listę elementów. Więcej informacji o zwizualizowanych elementach znajdziesz w krótkim wprowadzeniu do parsera faktur.

Uruchom notatnik ze wszystkich komórek i przewiń w dół do tabeli wyników. Poprzedni kod powtarza iterację przez każdą encję i tworzy obiekt danych Pandas DataFrame z wynikami. tabela

Przewiń w dół do komponentu wizualizacji. Odpowiedź obiektu Document zawiera informacje o układzie przestrzennym każdej strony w dokumencie. Poniżej informacje o układzie każdego pola formularza służą do rysowania ramek ograniczających na obrazie. Tych danych można użyć do integracji Document AI z aplikacją frontendową.

wielokąty

8. Gratulacje

Gratulujemy! Udało Ci się użyć rozwiązania Procurment Document AI do wyodrębniania danych z faktury. Zachęcamy do eksperymentowania z innymi typami formularzy.

Czyszczenie danych

Aby uniknąć obciążenia konta Google Cloud opłatami za zasoby zużyte w tym samouczku, możesz wyłączyć notatnik lub usunąć projekt GCP.

Wyłączam instancję Notatników AI Platform

Wykonaj te instrukcje, aby wyłączyć instancję Notatników w AI Platform.

Usuwam projekt

Najprostszym sposobem na uniknięcie płatności jest usunięcie projektu utworzonego na potrzeby samouczka.

Aby usunąć projekt:

  1. W konsoli GCP otwórz stronę Projekty. Strona Projekty
  2. Na liście projektów wybierz projekt do usunięcia, a następnie kliknij Usuń.
  3. W oknie wpisz identyfikator projektu i kliknij Wyłącz, aby usunąć projekt.

Więcej informacji

Licencja

To zadanie jest licencjonowane na podstawie ogólnej licencji Creative Commons Attribution 2.0.