Analizuj faktury za pomocą notatników w AI Platform za pomocą narzędzi Procurement Document AI

1. Omówienie

c65b9ae04aa1853.png

Co to jest Document AI dla zakupów?

Firmy zarządzają dużymi potokami zaopatrzenia, do których zaliczają się tysiące faktur, rachunków i innych powiązanych dokumentów rocznie. Korzystaj z Procurement DocAI, aby inteligentnie przetwarzać „ciemne dane”, takie jak pliki PDF, obrazy i formularze odręczne, i ograniczać ręczne koszty obsługi cyklu zamówień. Automatyzuj zbieranie danych dotyczących zamówień na dużą skalę, przekształcając nieuporządkowane dokumenty, takie jak faktury i rachunki, w uporządkowane dane, aby zwiększyć wydajność operacyjną, poprawić obsługę klienta i ułatwić podejmowanie decyzji.

W tym laboratorium kodu omówimy konfigurowanie platformy Document AI, przetwarzanie przykładowej faktury oraz wyodrębnianie i wizualizowanie obiektów w notatniku AI Platform.

Czego się nauczysz

  • Pierwsze kroki z Document AI Platform
  • Wyodrębnianie schematyzowanych jednostek za pomocą rozwiązania Document AI do obsługi zamówień
  • Tworzenie i dostosowywanie instancji notatników AI Platform

Czego potrzebujesz

  • Projekt Google Cloud
  • przeglądarka, np. Chrome lub Firefox;
  • znajomość Pythona 3,

Ankieta

Jak będziesz korzystać z tego samouczka?

Tylko przeczytać Przeczytać i wykonać ćwiczenia

Jak oceniasz swoje doświadczenie z Pythonem?

Początkujący Średnio zaawansowany Zaawansowany

Jak oceniasz korzystanie z usług Google Cloud?

Początkujący Średnio zaawansowany Zaawansowany

2. Konfiguracja i wymagania

Konfiguracja środowiska w samodzielnym tempie

  1. Zaloguj się w konsoli Google Cloud i utwórz nowy projekt lub użyj istniejącego. (jeśli nie masz jeszcze konta Gmail ani G Suite, utwórz je).

Zapamiętaj identyfikator projektu, który jest unikalną nazwą wśród wszystkich projektów Google Cloud. (Twoje imię i nazwisko jest już zajęte i nie będzie można go użyć) Musisz podać ten identyfikator jako PROJECT_ID.

  1. Aby korzystać z zasobów Google Cloud, musisz też włączyć płatności w Cloud Console.

Pamiętaj, aby postępować zgodnie z instrukcjami podanymi w sekcji „Oczyszczanie”. W tej sekcji znajdziesz wskazówki, jak wyłączyć zasoby, aby uniknąć opłat po zakończeniu samouczka. Nowi użytkownicy Google Cloud mogą skorzystać z bezpłatnego okresu próbnego, w którym mają do dyspozycji środki w wysokości 300 USD.

3. Włączanie interfejsu Cloud Document AI API

Zanim zaczniesz korzystać z Document AI, musisz włączyć interfejs API. Otwórz Cloud Console w przeglądarce.

  1. Kliknij Menu nawigacyjne ☰ > Interfejsy API i usługi > Biblioteka. Search API
  2. Wyszukaj „Document AI API”, a następnie kliknij Włącz, aby korzystać z interfejsu API w projekcie Google Cloud.

4. Tworzenie i testowanie procesora

W tym samouczku musisz najpierw utworzyć instancję procesora Form Parser, aby użyć go na platformie Document AI.

  1. W konsoli otwórz stronę Przegląd platformy Document AI.
  2. Kliknij Utwórz procesor i wybierz Parser fakturProcesory
  3. Podaj nazwę procesora i wybierz region z listy.
  4. Aby utworzyć procesor, kliknij Utwórz.
  5. Skopiuj identyfikator procesora. Będzie trzeba użyć go później w kodzie.

(Opcjonalnie) Możesz przetestować procesor w konsoli, przesyłając dokument. Kliknij Prześlij dokument i wybierz formularz do przeanalizowania. Jeśli nie masz odpowiedniego formularza, możesz pobrać i użyć tego przykładowego.

Faktura

Dane wyjściowe powinny wyglądać tak: Przetworzona faktura

5. Tworzenie notatki w AI Platform

W konsoli Cloud Console otwórz sekcję AI Platform Notebooks i kliknij Nowa instancja. Następnie wybierz najnowszy typ instancji Pythona:

a81c82876c6c16f9.png

Użyj domyślnych opcji i kliknij Utwórz. Po utworzeniu instancji kliknij Otwórz JupyterLab.

6. Pobieranie przykładowego kodu

Zaimportuj przykładowy kod bezpośrednio z repozytorium GitHub Notatek w Document AI. W notatniku otwórz w górnym menu Git > Klonuj repozytorium lub kliknij ikonę Git: Git

Wklej ten adres URL repozytorium:

https://github.com/GoogleCloudPlatform/documentai-notebooks.git

Po sklonowaniu repozytorium przejdź do katalogu documentai-notebooks/specialized/ i otwórz notatnika specialized_form_parser.ipynb. Znajdź komórkę, w której zadeklarowano identyfikatory projektu GCP i procesora Document AI.

vars

Wklej identyfikator projektu GCP i identyfikator procesora z kroku 4. Zapisz notatnik.

7. Wyodrębnianie i wizualizacja encji

Teraz możesz wyodrębnić ze schematycznych faktur encji i odpowiednie wskaźniki wiarygodności. Obiekt odpowiedzi Document zawiera listę elementów. Więcej informacji o schematyzowanych encjach znajdziesz w podręczniku użytkownika dotyczącym usługi Invoice Parser.

Uruchom wszystkie komórki w notatniku i przewiń w dół do danych wyjściowych w postaci tabeli. Poprzedni kod iteruje po każdym elemencie i tworzy strukturę DataFrame biblioteki Pandas z wynikami. tabela

Przewiń w dół do komponentu wizualizacji. Odpowiedź obiektu Document zawiera informacje o układzie przestrzennym każdej strony dokumentu. Poniżej informacje o układzie każdego pola formularza są używane do rysowania na obrazie ograniczonych pól. Te dane można wykorzystać do zintegrowania Document AI z aplikacją front-end.

polys

8. Gratulacje

Gratulacje! Udało Ci się wyodrębnić dane z faktury za pomocą rozwiązania Document AI do zakupów. Zachęcamy do eksperymentowania z innymi typami formularzy.

Czyszczenie danych

Aby uniknąć obciążenia konta Google Cloud opłatami za zasoby zużyte w tym samouczku, możesz zamknąć notebooka lub usunąć projekt GCP.

Wyłączanie instancji notatek w AI Platform

Aby wyłączyć instancję Notatek AI Platform, wykonaj te instrukcje.

Usuwanie projektu

Najprostszym sposobem na uniknięcie płatności jest usunięcie projektu utworzonego na potrzeby samouczka.

Aby usunąć projekt:

  1. W konsoli GCP otwórz stronę Projekty. Strona Projekty
  2. Na liście projektów wybierz projekt do usunięcia i kliknij Usuń.
  3. W oknie wpisz identyfikator projektu i kliknij Wyłącz, aby usunąć projekt.

Więcej informacji

Licencja

To zadanie jest licencjonowane na podstawie ogólnej licencji Creative Commons Attribution 2.0.