1. Omówienie
Czym jest Procurement Document AI?
Firmy zarządzają dużymi potokami zaopatrzenia, do których zaliczają się tysiące faktur, rachunków i innych powiązanych dokumentów rocznie. Korzystaj z Procurement DocAI, aby inteligentnie przetwarzać „ciemne dane”. takich jak PDF-y, obrazy i odręczne formularze, aby zmniejszyć nakład pracy w cyklu zakupowym. Zautomatyzuj pozyskiwanie danych dotyczących zamówień na dużą skalę, przekształcając nieuporządkowane dokumenty w faktury i rachunki w uporządkowane dane, aby zwiększyć wydajność operacyjną, poprawić wrażenia klientów i podejmować decyzje.
Z tego ćwiczenia w programie dowiesz się, jak skonfigurować Document AI Platform, przetworzyć przykładową fakturę oraz wyodrębnić i wizualizować encje w notatniku AI Platform.
Czego się nauczysz
- Jak zacząć korzystać z Document AI Platform
- Wyodrębnianie zwizualizowanych encji przy użyciu rozwiązania Procurement DocAI Solution
- Tworzenie i dostosowywanie instancji Notatników w AI Platform
Czego potrzebujesz
Ankieta
Jak wykorzystasz ten samouczek?
Jak oceniasz swoje doświadczenia z językiem Python?
Jak oceniasz korzystanie z usług Google Cloud?
2. Konfiguracja i wymagania
Samodzielne konfigurowanie środowiska
- Zaloguj się w konsoli Google Cloud i utwórz nowy projekt lub wykorzystaj już istniejący. Jeśli nie masz jeszcze konta Gmail lub G Suite, musisz je utworzyć.
Zapamiętaj identyfikator projektu, unikalną nazwę we wszystkich projektach Google Cloud. (Twoja nazwa jest już zajęta i nie będzie Ci odpowiadać). Musisz podać ten identyfikator później jako PROJECT_ID
.
- Następnie musisz włączyć płatności w Cloud Console, aby korzystać z zasobów Google Cloud.
Postępuj zgodnie z instrukcjami podanymi w sekcji „Czyszczenie” . W tej sekcji znajdziesz informacje na temat wyłączania zasobów, aby nie naliczać opłat po zakończeniu tego samouczka. Nowi użytkownicy Google Cloud mogą skorzystać z programu bezpłatnego okresu próbnego o wartości 300 USD.
3. Włączanie interfejsu Cloud Document AI API
Zanim zaczniesz korzystać z Document AI, musisz włączyć interfejs API. Otwórz konsolę Cloud w przeglądarce.
- Kliknij Menu nawigacyjne OK > Interfejsy API Usługi > Biblioteka.
- Wyszukaj „Document AI API”, a następnie kliknij Włącz, aby używać interfejsu API w projekcie Google Cloud.
4. Utwórz i przetestuj procesor
Musisz najpierw utworzyć instancję procesora parsera formularzy do użycia na platformie Document AI w tym samouczku.
- W konsoli przejdź do omówienia Document AI Platform.
- Kliknij Utwórz procesor i wybierz Invoice Parser.
- Podaj nazwę procesora i wybierz region z listy.
- Kliknij Utwórz, aby utworzyć procesor.
- Skopiuj identyfikator podmiotu przetwarzającego. Będzie trzeba użyć go później w kodzie.
(Opcjonalnie) Możesz przetestować procesor w konsoli, przesyłając dokument. Kliknij Prześlij dokument i wybierz formularz do przeanalizowania. Jeśli nie masz jeszcze odpowiedniego formularza, możesz go pobrać i wykorzystać.
Dane wyjściowe powinny wyglądać tak:
5. Tworzenie notatki w AI Platform
Przejdź do sekcji Notatników AI Platform w konsoli Cloud i kliknij Nowa instancja. Następnie wybierz najnowszy typ instancji Pythona:
Użyj opcji domyślnych i kliknij Utwórz. Po utworzeniu instancji wybierz Otwórz JupyterLab.
6. Pobierz przykładowy kod
Bezpośrednio zaimportuj przykładowy kod z repozytorium GitHub w notatnikach Document AI. W notatniku otwórz Git > Sklonuj repozytorium w menu u góry lub kliknij ikonę Git:
Wklej ten adres URL repozytorium:
https://github.com/GoogleCloudPlatform/documentai-notebooks.git
Po sklonowaniu repozytorium kliknij katalog documentai-notebooks/specialized/ i otwórz notatnik specialized_form_parser.ipynb
. Znajdź komórkę, w której zadeklarowano identyfikatory projektu GCP i procesora Document AI.
Wklej identyfikator projektu GCP i identyfikator procesora z kroku 4. Zapisz notatnik.
7. Wyodrębnianie i wizualizowanie encji
Teraz możesz wyodrębnić zwizualizowane encje z faktur i odpowiadające im wskaźniki ufności. Obiekt odpowiedzi Document zawiera listę elementów. Więcej informacji o zwizualizowanych elementach znajdziesz w krótkim wprowadzeniu do parsera faktur.
Uruchom notatnik ze wszystkich komórek i przewiń w dół do tabeli wyników. Poprzedni kod powtarza iterację przez każdą encję i tworzy obiekt danych Pandas DataFrame z wynikami.
Przewiń w dół do komponentu wizualizacji. Odpowiedź obiektu Document zawiera informacje o układzie przestrzennym każdej strony w dokumencie. Poniżej informacje o układzie każdego pola formularza służą do rysowania ramek ograniczających na obrazie. Tych danych można użyć do integracji Document AI z aplikacją frontendową.
8. Gratulacje
Gratulujemy! Udało Ci się użyć rozwiązania Procurment Document AI do wyodrębniania danych z faktury. Zachęcamy do eksperymentowania z innymi typami formularzy.
Czyszczenie danych
Aby uniknąć obciążenia konta Google Cloud opłatami za zasoby zużyte w tym samouczku, możesz wyłączyć notatnik lub usunąć projekt GCP.
Wyłączam instancję Notatników AI Platform
Wykonaj te instrukcje, aby wyłączyć instancję Notatników w AI Platform.
Usuwam projekt
Najprostszym sposobem na uniknięcie płatności jest usunięcie projektu utworzonego na potrzeby samouczka.
Aby usunąć projekt:
- W konsoli GCP otwórz stronę Projekty. Strona Projekty
- Na liście projektów wybierz projekt do usunięcia, a następnie kliknij Usuń.
- W oknie wpisz identyfikator projektu i kliknij Wyłącz, aby usunąć projekt.