1. Omówienie
Co to jest Document AI dla zakupów?
Firmy zarządzają dużymi potokami zaopatrzenia, do których zaliczają się tysiące faktur, rachunków i innych powiązanych dokumentów rocznie. Korzystaj z Procurement DocAI, aby inteligentnie przetwarzać „ciemne dane”, takie jak pliki PDF, obrazy i formularze odręczne, i ograniczać ręczne koszty obsługi cyklu zamówień. Automatyzuj zbieranie danych dotyczących zamówień na dużą skalę, przekształcając nieuporządkowane dokumenty, takie jak faktury i rachunki, w uporządkowane dane, aby zwiększyć wydajność operacyjną, poprawić obsługę klienta i ułatwić podejmowanie decyzji.
W tym laboratorium kodu omówimy konfigurowanie platformy Document AI, przetwarzanie przykładowej faktury oraz wyodrębnianie i wizualizowanie obiektów w notatniku AI Platform.
Czego się nauczysz
- Pierwsze kroki z Document AI Platform
- Wyodrębnianie schematyzowanych jednostek za pomocą rozwiązania Document AI do obsługi zamówień
- Tworzenie i dostosowywanie instancji notatników AI Platform
Czego potrzebujesz
Ankieta
Jak będziesz korzystać z tego samouczka?
Jak oceniasz swoje doświadczenie z Pythonem?
Jak oceniasz korzystanie z usług Google Cloud?
2. Konfiguracja i wymagania
Konfiguracja środowiska w samodzielnym tempie
- Zaloguj się w konsoli Google Cloud i utwórz nowy projekt lub użyj istniejącego. (jeśli nie masz jeszcze konta Gmail ani G Suite, utwórz je).
Zapamiętaj identyfikator projektu, który jest unikalną nazwą wśród wszystkich projektów Google Cloud. (Twoje imię i nazwisko jest już zajęte i nie będzie można go użyć) Musisz podać ten identyfikator jako PROJECT_ID
.
- Aby korzystać z zasobów Google Cloud, musisz też włączyć płatności w Cloud Console.
Pamiętaj, aby postępować zgodnie z instrukcjami podanymi w sekcji „Oczyszczanie”. W tej sekcji znajdziesz wskazówki, jak wyłączyć zasoby, aby uniknąć opłat po zakończeniu samouczka. Nowi użytkownicy Google Cloud mogą skorzystać z bezpłatnego okresu próbnego, w którym mają do dyspozycji środki w wysokości 300 USD.
3. Włączanie interfejsu Cloud Document AI API
Zanim zaczniesz korzystać z Document AI, musisz włączyć interfejs API. Otwórz Cloud Console w przeglądarce.
- Kliknij Menu nawigacyjne ☰ > Interfejsy API i usługi > Biblioteka.
- Wyszukaj „Document AI API”, a następnie kliknij Włącz, aby korzystać z interfejsu API w projekcie Google Cloud.
4. Tworzenie i testowanie procesora
W tym samouczku musisz najpierw utworzyć instancję procesora Form Parser, aby użyć go na platformie Document AI.
- W konsoli otwórz stronę Przegląd platformy Document AI.
- Kliknij Utwórz procesor i wybierz Parser faktur
- Podaj nazwę procesora i wybierz region z listy.
- Aby utworzyć procesor, kliknij Utwórz.
- Skopiuj identyfikator procesora. Będzie trzeba użyć go później w kodzie.
(Opcjonalnie) Możesz przetestować procesor w konsoli, przesyłając dokument. Kliknij Prześlij dokument i wybierz formularz do przeanalizowania. Jeśli nie masz odpowiedniego formularza, możesz pobrać i użyć tego przykładowego.
Dane wyjściowe powinny wyglądać tak:
5. Tworzenie notatki w AI Platform
W konsoli Cloud Console otwórz sekcję AI Platform Notebooks i kliknij Nowa instancja. Następnie wybierz najnowszy typ instancji Pythona:
Użyj domyślnych opcji i kliknij Utwórz. Po utworzeniu instancji kliknij Otwórz JupyterLab.
6. Pobieranie przykładowego kodu
Zaimportuj przykładowy kod bezpośrednio z repozytorium GitHub Notatek w Document AI. W notatniku otwórz w górnym menu Git > Klonuj repozytorium lub kliknij ikonę Git:
Wklej ten adres URL repozytorium:
https://github.com/GoogleCloudPlatform/documentai-notebooks.git
Po sklonowaniu repozytorium przejdź do katalogu documentai-notebooks/specialized/ i otwórz notatnika specialized_form_parser.ipynb
. Znajdź komórkę, w której zadeklarowano identyfikatory projektu GCP i procesora Document AI.
Wklej identyfikator projektu GCP i identyfikator procesora z kroku 4. Zapisz notatnik.
7. Wyodrębnianie i wizualizacja encji
Teraz możesz wyodrębnić ze schematycznych faktur encji i odpowiednie wskaźniki wiarygodności. Obiekt odpowiedzi Document zawiera listę elementów. Więcej informacji o schematyzowanych encjach znajdziesz w podręczniku użytkownika dotyczącym usługi Invoice Parser.
Uruchom wszystkie komórki w notatniku i przewiń w dół do danych wyjściowych w postaci tabeli. Poprzedni kod iteruje po każdym elemencie i tworzy strukturę DataFrame biblioteki Pandas z wynikami.
Przewiń w dół do komponentu wizualizacji. Odpowiedź obiektu Document zawiera informacje o układzie przestrzennym każdej strony dokumentu. Poniżej informacje o układzie każdego pola formularza są używane do rysowania na obrazie ograniczonych pól. Te dane można wykorzystać do zintegrowania Document AI z aplikacją front-end.
8. Gratulacje
Gratulacje! Udało Ci się wyodrębnić dane z faktury za pomocą rozwiązania Document AI do zakupów. Zachęcamy do eksperymentowania z innymi typami formularzy.
Czyszczenie danych
Aby uniknąć obciążenia konta Google Cloud opłatami za zasoby zużyte w tym samouczku, możesz zamknąć notebooka lub usunąć projekt GCP.
Wyłączanie instancji notatek w AI Platform
Aby wyłączyć instancję Notatek AI Platform, wykonaj te instrukcje.
Usuwanie projektu
Najprostszym sposobem na uniknięcie płatności jest usunięcie projektu utworzonego na potrzeby samouczka.
Aby usunąć projekt:
- W konsoli GCP otwórz stronę Projekty. Strona Projekty
- Na liście projektów wybierz projekt do usunięcia i kliknij Usuń.
- W oknie wpisz identyfikator projektu i kliknij Wyłącz, aby usunąć projekt.