1. Wprowadzenie
Document AI API to rozwiązanie do rozumienia dokumentów, które wykorzystuje nieuporządkowane dane, takie jak dokumenty czy e-maile, i ułatwia ich analizowanie, analizowanie i wykorzystywanie.
Weryfikacja manualna pozwala zwiększyć dokładność przetwarzania dokumentów i zapewnić większą dokładność. Sprawdzenie przez weryfikatora może zwiększyć dokładność i ułatwi firmom ocenę prognoz za pomocą specjalnych narzędzi, które umożliwiają przeprowadzanie takich weryfikacji. W tym module skonfigurujesz i przetestujesz procesor wydatków, korzystając z weryfikacji manualnej, aby zweryfikować wyniki pochodzące z procesora za pomocą narzędzi do konfiguracji i zarządzania w ramach procesu z udziałem człowieka.
Wymagania wstępne
To ćwiczenie w Codelabs opiera się na materiałach prezentowanych w innych ćwiczeniach z programowania Document AI.
Przed kontynuowaniem zalecamy ukończenie poniższych ćwiczeń z programowania.
- Optyczne rozpoznawanie znaków (OCR) w Document AI (Python)
- Analiza formularzy przy użyciu Document AI (Python)
- Specjalne procesory z Document AI (Python)
Czego się nauczysz
- Skonfiguruj weryfikację manualną dla podmiotu przetwarzającego.
- Utwórz pulę zasobów użytkowników weryfikacji manualnej.
- Utwórz testowe zadanie weryfikacji manualnej.
- Przypisz użytkownikowi zadanie sprawdzania przez weryfikatora.
- Sprawdzenie dokumentu przez weryfikatora.
Czego potrzebujesz
2. Przygotowanie
W tym ćwiczeniu w programowaniu zakładamy, że masz już za sobą kroki konfiguracji Document AI wymienione w podstawowych ćwiczeniach z programowania.
Zanim przejdziesz dalej, wykonaj te czynności:
- Uruchamianie Cloud Shell
- Włącz Document AI Interfejsy API Cloud Storage
- Instalowanie biblioteki klienta Pythona
Musisz też włączyć interfejs Vertex AI API.
- Na pasku wyszukiwania u góry konsoli wyszukaj „Vertex AI API”, a następnie kliknij Włącz, aby używać interfejsu API w projekcie Google Cloud
- Interfejs API można też włączyć za pomocą tego polecenia
gcloud
.
gcloud services enable aiplatform.googleapis.com
3. Utwórz procesor
Musisz najpierw utworzyć instancję procesora na potrzeby tego modułu.
- W konsoli przejdź do omówienia Document AI Platform.
- Kliknij Utwórz procesor, przewiń w dół do sekcji Specjalistyczne i wybierz Parser wydatków.
- Nadaj mu nazwę
codelab-expense-parser
(albo coś innego, co zapamiętasz) i wybierz na liście najbliższy region. - Kliknij Utwórz, aby utworzyć procesor.
- Skopiuj identyfikator procesora. Będzie trzeba użyć go później w kodzie.
- Utwórz w Cloud Shell zasobnik na dane, używając nazwy
PROJECT_ID-hitl-results
:
export PROJECT_ID=$(gcloud config get-value core/project)
gsutil mb gs://$PROJECT_ID-hitl-results
- Powiąż swoje konto użytkownika z rolą uprawnień administratora Vertex AI w projekcie modułu.
export USER_ACCOUNT=$(gcloud config get-value core/account)
gcloud projects add-iam-policy-binding $PROJECT_ID --member=user:$USER_ACCOUNT --role=roles/aiplatform.admin
4. Konfigurowanie procesu z udziałem człowieka
W tym zadaniu skonfigurujesz weryfikację manualną dla utworzonego wcześniej podmiotu przetwarzającego wydatki.
- W konsoli otwórz Menu nawigacyjne i wybierz Document AI.
- Kliknij AI z udziałem człowieka.
- Kliknij
codelab-expense-parser
, aby otworzyć stronę weryfikacji manualnej firmy obsługującej płatności. - Kliknij Skonfiguruj proces z udziałem człowieka.
- Wybierz Filtr na poziomie dokumentu.
- Ustaw suwak Poziom ufności (%) na 50%.
- Zostaw w opcji Specjaliści ustawienie Korzystaj z własnych specjalistów.
- Kliknij menu Pula specjalistów, a następnie NOWA PULI ŚRODKÓW DLA SPECJALISTY.
- W polu Pool name (Nazwa puli) wpisz
Codelab HITL Pool
w oknie Nowa pula specjalistów. - Wpisz swój osobisty adres e-mail menedżerów puli i specjalistów.
- Kliknij Utwórz pulę.
Ich wykonanie może potrwać kilka minut. Otrzymasz e-maila z adresu Vertex AI noreply-vertex@google.com
.
- Nie zaznaczaj pola wyboru Automatyczne przypisywanie.
- Kliknij pole wyboru w sekcji Potwierdź opłaty.
- Kliknij Lokalizacja instrukcji i skopiuj ją w tym miejscu: – NIE dodawaj prefiksu
gs://
w ścieżce.
cloud-samples-data/documentai/codelabs/hitl/hitl-instructions.pdf
- W sekcji Lokalizacja wyników kliknij Przeglądaj i wybierz utworzony wcześniej zasobnik Cloud Storage.
- Kliknij Wybierz.
- Kliknij Save Configuration (Zapisz konfigurację).
W konsoli pojawi się komunikat Konfigurowanie procesu z człowiekiem, co zajmie kilka minut.
- Gdy konfiguracja zostanie ukończona, w konsoli wyświetli się prośba o włączenie procesu z udziałem człowieka.
- Kliknij przycisk Przełącz, aby go włączyć.
- Następnie w wyskakującym okienku kliknij WŁĄCZ.
Prześlij przykładowy formularz wydatków
- Przygotowaliśmy przykładowy formularz do wykorzystania w Google Cloud Storage. Możesz ją pobrać, używając tego przycisku lub polecenia:
gsutil cp gs://cloud-samples-data/documentai/codelabs/hitl/expense-claim.pdf .
- Po włączeniu procesu z udziałem człowieka kliknij przycisk Prześlij dokument i znajdź pobrany przed chwilą przykładowy dokument.
- Kliknij Prześlij i poczekaj na zakończenie tego procesu.
5. Przypisywanie elementu do sprawdzenia przez weryfikatora
- Na tej stronie powinny być widoczne linki do konsol menedżera pul i konsol specjalistów. Te linki pojawią się też w e-mailu od
Vertex AI noreply-vertex@google.com
.- Powinien wyglądać podobnie do tych:
https://datacompute.google.com/cm/cloudml_data_specialists_us_central1_xxxxxxx/tasks
- Kliknij link do konsoli menedżera.
- Powinien wyglądać podobnie do tych:
- W konsoli dodawania etykiet do danych kliknij tytuł karty Tasks (Zadania), aby otworzyć stronę przypisywania zadań.
- Kliknij pole wyboru Nieprzypisane. W kolejce zadań codelab-expense-parser-P1 powinien pojawić się nowy wpis.
- Wybierz codelab-expense-parser-P1.
- Kliknij Zarządzaj projektem.
- Wpisz swój prywatny adres e-mail w polu Dodaj specjalistów przez e-maila i wybierz go z listy.
- Kliknij Zastosuj.
Na ekranie pojawi się informacja, że zadanie jest przypisane do Ciebie. Może minąć kilka minut, zanim zmiany staną się widoczne i rozpowszechnione.
- Wybierz nowego użytkownika i kliknij ikonę menu.
- W wyświetlonym menu kliknij Przypisz do wszystkich zadań.
- Kliknij Zatwierdź zmiany.
- Kliknij Zatwierdź.
6. Sprawdzenie przez weryfikatora
- Wróć na stronę konfiguracji procesu z udziałem człowieka w konsoli Cloud.
Kliknij link, aby otworzyć konsolę specjalisty (instancji roboczej). To będzie wyglądać tak: https://datacompute.google.com/w/cloudml_data_specialists_us_central1_xxxxxxxxxxx
.
Konsola instancji roboczych powinna się otworzyć i wyświetlić nowe zadanie.
- Najedź kursorem na element zamówienia zawierający Spotkanie z 4 min i kliknij ikonę edytuj (ołówek).
- Zmień wartość na Spotkanie z Adamem. Aby go zobaczyć, konieczne może być przewinięcie okna tekstowego w dół.
- Kliknij Zastosuj.
- Kliknij ikonę Potwierdź (zielony znacznik wyboru) przy elemencie poniżej.
- Kliknij ikonę Potwierdź przy pozostałych wyróżnionych elementach.
- Kliknij Prześlij. Zadanie weryfikacji zostało usunięte z kolejki osób oznaczających etykietami.
7. Wyświetl ukończone zadania
- Wróć do konsoli menedżera.
- Kliknij Lista zadań i wybierz Bieżące
- Kliknij Specjaliści.
- Wybierz swój adres e-mail.
- Kliknij Zarządzaj projektem.
- Z menu
Select specialists working on specific tasks
iSelect tasks
wybierz expense-processor-P1. W przypadku każdej z nich kliknij Zastosuj. W menu kontekstowym zasobu expense-processor-P1, które zostało Ci przypisane, kliknij Wyświetl specjalistów.
Gdy zadanie oznaczania etykietami prześle osoba oznaczająca etykietami, liczba zadań z odpowiedziami i łączny czas trwania zostaną zaktualizowane, ale wyświetlenie danych w tym widoku może potrwać kilka minut.
- Zamknij wyskakujące okienko specjalistów i otwórz kartę Specjaliści.
- Kliknij menu kontekstowe swojej nazwy użytkownika i wybierz Wyświetl zadania.
Ten widok przedstawia listę zadań użytkownika, liczbę ich ukończenia oraz czas potrzebny na ukończenie zadania, jak pokazano poniżej:
8. Gratulacje
Gratulujemy! Udało Ci się skonfigurować weryfikację manualną dokumentów przetwarzanych przy użyciu procesora wydatków Document AI za pomocą procesu z udziałem człowieka w Document AI.
Czyszczenie
Aby uniknąć obciążenia konta Google Cloud opłatami za zasoby zużyte w tym samouczku:
- W konsoli Cloud otwórz stronę Zarządzanie zasobami.
- Na liście projektów wybierz swój projekt i kliknij Usuń.
- W oknie wpisz identyfikator projektu i kliknij Wyłącz, aby usunąć projekt.
Więcej informacji
Dowiedz się więcej o Document AI dzięki tym dodatkowym ćwiczeniom z programowania.
Materiały
- Przyszłość dokumentów – playlista w YouTube
- Dokumentacja Document AI
- Biblioteka klienta Document AI w Pythonie
- Przykłady Document AI
Licencja
To zadanie jest licencjonowane na podstawie ogólnej licencji Creative Commons Attribution 2.0.