Agent GenAI do kontroli jakości dokumentów i wywołań interfejsu API

1. Omówienie

W tym module utworzysz agenta GenAI, połączysz go z aplikacją Cloud Run i zintegrujesz go z workspace’em Slack.

8541c95a7fbc9be7.png

Czego się nauczysz

Laboratorium składa się z kilku głównych części:

  • Wdrażanie aplikacji Cloud Run w celu integracji z interfejsami Gemini API
  • Tworzenie i wdrażanie agenta Vertex AI
  • Integracja agenta z Slackiem
  • Konfigurowanie magazynu danych na potrzeby pytań i odpowiedzi dotyczących dokumentów PDF

Wymagania wstępne

  • Ten moduł zakłada, że znasz środowiska Cloud Console i Cloud Shell.

2. Konfiguracja i wymagania

Konfiguracja projektu Cloud

  1. Zaloguj się w konsoli Google Cloud i utwórz nowy projekt lub użyj istniejącego. Jeśli nie masz jeszcze konta Gmail ani Google Workspace, musisz je utworzyć.

fbef9caa1602edd0.png

a99b7ace416376c4.png

5e3ff691252acf41.png

  • Nazwa projektu to wyświetlana nazwa uczestników tego projektu. Jest to ciąg znaków, którego nie używają interfejsy API Google. Zawsze możesz ją zaktualizować.
  • Identyfikator projektu jest niepowtarzalny w ramach wszystkich projektów Google Cloud i nie można go zmienić (po ustawieniu). Konsola Cloud automatycznie generuje unikalny ciąg znaków. Zwykle nie ma znaczenia, jaki to ciąg. W większości laboratoriów z kodem trzeba podać identyfikator projektu (zwykle oznaczony jako PROJECT_ID). Jeśli nie podoba Ci się wygenerowany identyfikator, możesz wygenerować inny losowy. Możesz też spróbować użyć własnego adresu e-mail, aby sprawdzić, czy jest on dostępny. Nie można go zmienić po wykonaniu tego kroku. Pozostanie on na stałe w ramach projektu.
  • Informacyjnie: istnieje jeszcze 3 wartość, numer projektu, której używają niektóre interfejsy API. Więcej informacji o wszystkich 3 wartościach znajdziesz w dokumentacji.
  1. Następnie musisz włączyć rozliczenia w konsoli Cloud, aby korzystać z zasobów i interfejsów API Cloud. Przejście przez ten samouczek nie będzie kosztowne, a być może nawet bezpłatne. Aby wyłączyć zasoby i uniknąć obciążenia opłatami po zakończeniu samouczka, możesz usunąć utworzone zasoby lub usunąć projekt. Nowi użytkownicy Google Cloud mogą skorzystać z bezpłatnego okresu próbnego, w którym mają do dyspozycji środki w wysokości 300 USD.

Konfiguracja środowiska

Otwórz czat Gemini.

e1e9ad314691368a.png

Włącz interfejs Cloud AI Companion API:

66cb6e561e384bbf.png

Kliknij „Start chatting” i użyj jednego z przykładowych pytań lub wpisz własne prompty, aby je wypróbować.

5482c153eef23126.png

Prompty do wypróbowania:

  • Wyjaśnij Cloud Run w 5 kluczowych punktach.
  • Jesteś menedżerem produktu Google Cloud Run. Wyjaśnij studentowi, na czym polega Cloud Run, w 5 krótkich punktach.
  • Jesteś menedżerem produktu Cloud Run w Google i chcesz wyjaśnić Cloud Run certyfikowanemu deweloperowi Kubernetes w 5 krótkich punktach.
  • Jesteś menedżerem produktu Cloud Run w Google i chcesz wyjaśnić starszemu programiście, kiedy należy używać Cloud Run, a kiedy GKE. W tym celu przedstawiasz 5 krótkich kluczowych informacji.

Aby dowiedzieć się więcej o pisaniu lepszych promptów, zapoznaj się z przewodnikiem po promptach.

Jak Gemini dla Google Cloud korzysta z Twoich danych

Zobowiązanie Google do ochrony prywatności

Google jako jedna z pierwszych firm w branży opublikowała zobowiązanie do ochrony prywatności w systemach AI/ML, w którym wyraziliśmy przekonanie, że klienci powinni mieć najwyższy poziom bezpieczeństwa i kontroli nad swoimi danymi przechowywanymi w chmurze.

Dane, które przesyłasz i odbierasz

Pytania, które zadajesz Gemini, w tym wszelkie informacje wejściowe lub kod, które przesyłasz do Gemini w celu analizy lub uzupełnienia, nazywamy promptami. Odpowiedzi lub dokończenia kodu, które otrzymujesz od Gemini, nazywane są odpowiedziami. Gemini nie używa Twoich promptów ani swoich odpowiedzi jako danych do trenowania swoich modeli.

Szyfrowanie promptów

Gdy przesyłasz prompty do Gemini, Twoje dane są szyfrowane podczas przesyłania i przesyłane do modelu podstawowego w Gemini.

Dane programu wygenerowane przez Gemini

Gemini jest trenowany na podstawie własnego kodu Google Cloud oraz wybranego kodu zewnętrznego. Ponosisz odpowiedzialność za bezpieczeństwo, testowanie i skuteczność kodu, w tym za uzupełnianie, generowanie i analizowanie kodu przez Gemini.

Dowiedz się więcej o tym, jak Google radzi sobie z potwierdzeniami.

3. Opcje testowania promptów

Możesz testować prompty na kilka sposobów.

Vertex AI Studio jest częścią platformy Vertex AI w Google Cloud, która została zaprojektowana z myślą o uproszczeniu i przyspieszeniu tworzenia oraz stosowania modeli generatywnej AI.

Google AI Studio to internetowe narzędzie do tworzenia prototypów i eksperymentowania z inżynierią promptów oraz interfejsem Gemini API.

Aplikacja internetowa Google Gemini (gemini.google.com) to narzędzie internetowe, które ułatwia poznawanie i wykorzystywanie potencjału modeli sztucznej inteligencji Gemini od Google.

4. Kopiowanie repozytorium

Wróć do Google Cloud Console i aktywuj Cloud Shell, klikając ikonę po prawej stronie paska wyszukiwania.

3e0c761ca41f315e.png

W otwartym terminalu uruchom te polecenia:

git clone https://github.com/GoogleCloudPlatform/genai-for-developers.git

cd genai-for-developers

git checkout slack-agent-jira-lab

Kliknij „Otwórz edytor”.

63e838aebfdd2423.png

Użyj elementu menu „File / Open Folder”, aby otworzyć „genai-for-developers”.

e3b9bd9682acf539.png

Otwórz nowy terminal

62dccf5c78880ed9.png

5. Utwórz konto usługi

Utwórz nowe konto usługi i klucze.

Z tego konta usługi będziesz korzystać do wywoływania interfejsu Vertex AI Gemini API z aplikacji Cloud Run.

Skonfiguruj szczegóły projektu, korzystając z szczegółów projektu qwiklabs.

Przykład: qwiklabs-gcp-00-2c10937585bb

gcloud config set project YOUR_QWIKLABS_PROJECT_ID

Utwórz konto usługi i przyznaj mu role.

export LOCATION=us-central1
export PROJECT_ID=$(gcloud config get-value project)
export SERVICE_ACCOUNT_NAME='vertex-client'
export DISPLAY_NAME='Vertex Client'
export KEY_FILE_NAME='vertex-client-key'

gcloud iam service-accounts create $SERVICE_ACCOUNT_NAME --project $PROJECT_ID --display-name "$DISPLAY_NAME"

gcloud projects add-iam-policy-binding $PROJECT_ID --member="serviceAccount:$SERVICE_ACCOUNT_NAME@$PROJECT_ID.iam.gserviceaccount.com" --role="roles/aiplatform.admin"

gcloud projects add-iam-policy-binding $PROJECT_ID --member="serviceAccount:$SERVICE_ACCOUNT_NAME@$PROJECT_ID.iam.gserviceaccount.com" --role="roles/aiplatform.user"

gcloud projects add-iam-policy-binding $PROJECT_ID --member="serviceAccount:$SERVICE_ACCOUNT_NAME@$PROJECT_ID.iam.gserviceaccount.com" --role="roles/cloudbuild.builds.editor"

gcloud projects add-iam-policy-binding $PROJECT_ID --member="serviceAccount:$SERVICE_ACCOUNT_NAME@$PROJECT_ID.iam.gserviceaccount.com" --role="roles/artifactregistry.admin"

gcloud projects add-iam-policy-binding $PROJECT_ID --member="serviceAccount:$SERVICE_ACCOUNT_NAME@$PROJECT_ID.iam.gserviceaccount.com" --role="roles/storage.admin"

gcloud projects add-iam-policy-binding $PROJECT_ID --member="serviceAccount:$SERVICE_ACCOUNT_NAME@$PROJECT_ID.iam.gserviceaccount.com" --role="roles/run.admin"

gcloud projects add-iam-policy-binding $PROJECT_ID --member="serviceAccount:$SERVICE_ACCOUNT_NAME@$PROJECT_ID.iam.gserviceaccount.com" --role="roles/secretmanager.secretAccessor"


gcloud iam service-accounts keys create $KEY_FILE_NAME.json --iam-account=$SERVICE_ACCOUNT_NAME@$PROJECT_ID.iam.gserviceaccount.com

Jeśli pojawi się pytanie o autoryzację, kliknij „Autoryzuj”, aby kontynuować.

6356559df3eccdda.png

Włącz wymagane usługi, aby korzystać z interfejsów API Vertex AI i czatu Gemini.

gcloud services enable \
    generativelanguage.googleapis.com \
    aiplatform.googleapis.com \
    cloudaicompanion.googleapis.com \
    run.googleapis.com \
    cloudresourcemanager.googleapis.com

Włącz wymagane usługi, aby korzystać z interfejsów API Vertex AI i czatu Gemini.

gcloud services enable \
    artifactregistry.googleapis.com \
    cloudbuild.googleapis.com \
    runapps.googleapis.com \
    workstations.googleapis.com \
    servicemanagement.googleapis.com \
    secretmanager.googleapis.com \
    containerscanning.googleapis.com

Włączanie Gemini Code Assist

Kliknij ikonę „Gemini”, a potem w prawym dolnym rogu kliknij „Sign-in” i „Select Google Cloud project”.

4a7f4640f66037f.png

8b4405d7366d2cad.png

bd07352707166136.png

W wyskakującym okienku wybierz projekt Qwiklabs.

Przykład:

70ae6837db397e2a.png

Otwórz plik „devai-api/app/routes.py”, a potem kliknij prawym przyciskiem myszy dowolne miejsce w pliku i w menu kontekstowym wybierz „Gemini Code Assist > Explain this"”.

e54daef175df3cf0.png

Przeczytaj wyjaśnienie Gemini dotyczące wybranego pliku.

e666676dce8b94d6.png

6. Wdrażanie interfejsu Devai-API w Cloud Run

Sprawdź, czy jesteś we właściwym folderze.

cd ~/genai-for-developers/devai-api

W tym laboratorium postępujemy zgodnie ze sprawdzonymi metodami i używamy usługi Secret Manager do przechowywania wartości klucza dostępu i klucza interfejsu LangChain API w Cloud Run oraz do odwoływania się do nich.

Ustaw zmienne środowiskowe.

export JIRA_API_TOKEN=your-jira-token
export JIRA_USERNAME="YOUR-EMAIL"
export JIRA_INSTANCE_URL="https://YOUR-JIRA-PROJECT.atlassian.net"
export JIRA_PROJECT_KEY="YOUR-JIRA-PROJECT-KEY"
export JIRA_CLOUD=true

export GITLAB_PERSONAL_ACCESS_TOKEN=your-gitlab-token
export GITLAB_URL="https://gitlab.com"
export GITLAB_BRANCH="devai"
export GITLAB_BASE_BRANCH="main"
export GITLAB_REPOSITORY="GITLAB-USERID/GITLAB-REPO"

export LANGCHAIN_API_KEY=your-langchain-key
export LANGCHAIN_TRACING_V2=true
export LANGCHAIN_ENDPOINT="https://api.smith.langchain.com"

Zapisz token dostępu JIRA w usłudze Secret Manager.

echo -n $JIRA_API_TOKEN | \
 gcloud secrets create JIRA_API_TOKEN \
 --data-file=-

Zapisz token dostępu GitLab w usłudze Secret Manager.

echo -n $GITLAB_PERSONAL_ACCESS_TOKEN | \
 gcloud secrets create GITLAB_PERSONAL_ACCESS_TOKEN \
 --data-file=-

Przechowuj klucz API LangChain w Secret Managerze.

echo -n $LANGCHAIN_API_KEY | \
 gcloud secrets create LANGCHAIN_API_KEY \
 --data-file=-

Wdróż aplikację w Cloud Run.

gcloud run deploy devai-api \
  --source=. \
  --region="$LOCATION" \
  --allow-unauthenticated \
  --service-account vertex-client \
  --set-env-vars PROJECT_ID="$PROJECT_ID" \
  --set-env-vars LOCATION="$LOCATION" \
  --set-env-vars GITLAB_URL="$GITLAB_URL" \
  --set-env-vars GITLAB_REPOSITORY="$GITLAB_REPOSITORY" \
  --set-env-vars GITLAB_BRANCH="$GITLAB_BRANCH" \
  --set-env-vars GITLAB_BASE_BRANCH="$GITLAB_BASE_BRANCH" \
  --set-env-vars JIRA_USERNAME="$JIRA_USERNAME" \
  --set-env-vars JIRA_INSTANCE_URL="$JIRA_INSTANCE_URL" \
  --set-env-vars JIRA_PROJECT_KEY="$JIRA_PROJECT_KEY" \
  --set-env-vars JIRA_CLOUD="$JIRA_CLOUD" \
  --set-env-vars LANGCHAIN_TRACING_V2="$LANGCHAIN_TRACING_V2" \
  --update-secrets="LANGCHAIN_API_KEY=LANGCHAIN_API_KEY:latest" \
  --update-secrets="GITLAB_PERSONAL_ACCESS_TOKEN=GITLAB_PERSONAL_ACCESS_TOKEN:latest" \
  --update-secrets="JIRA_API_TOKEN=JIRA_API_TOKEN:latest" \
  --min-instances=1 \
  --max-instances=3

Odpowiedź Y: utwórz repozytorium Dockera w Artifact Registry.

Deploying from source requires an Artifact Registry Docker repository to store built containers. A repository named [cloud-run-source-deploy] in 
region [us-central1] will be created.

Do you want to continue (Y/n)?  y

Poproś Gemini o wyjaśnienie polecenia:

94d5487568b08dd2.png

Zapoznaj się z procesem gcloud run deploy SERVICE_NAME --source=. poniżej. Więcej informacji

5c122a89dd11822e.png

W tle to polecenie używa usług buildpacksCloud Build Google Cloud do automatycznego kompilowania obrazów kontenera z Twojego kodu źródłowego bez konieczności instalowania Dockera na komputerze ani konfigurowania pakietów kompilacji ani Cloud Build. Oznacza to, że jedno polecenie opisane powyżej wykonuje to samo, co wymagałoby użycia poleceń gcloud builds submitgcloud run deploy.

Jeśli podano plik Dockerfile(jak w tym repozytorium), usługa Cloud Build użyje go do kompilowania obrazów kontenera zamiast polegać na pakietach kompilacji, które automatycznie wykrywają i kompilują obrazy kontenera. Więcej informacji o pakietach kompilacji znajdziesz w dokumentacji.

Sprawdź dzienniki Cloud Build w konsoli.

Sprawdź utworzony obraz Dockera w Artifact Registry.

Otwórz cloud-run-source-deploy/devai-api i sprawdź luki w zabezpieczeniach, które zostały wykryte automatycznie. Sprawdź te, dla których dostępne są poprawki, i sprawdź, jak można je rozwiązać na podstawie opisu.

d00c9434b511be44.png

Sprawdź szczegóły instancji Cloud Run w Cloud Console.

Przetestuj punkt końcowy, wykonując polecenie curl.

curl -X POST \
   -H "Content-Type: application/json" \
   -d '{"prompt": "PROJECT-100"}' \
   $(gcloud  run services list --filter="(devai-api)" --format="value(URL)")/generate

Wyniki weryfikacji:

bda86deaa1c449a8.png

7. Kreator agentów Vertex AI

Wyszukaj i otwórz „Kreator agenta”.

b99ae5b6ca1d6340.png

Aktywowanie interfejsów API

4bf2b240bd51db8.png

Utwórz aplikację Agent:

2e50007e454b504.png

W polu Nazwa wyświetlana wpisz „Agent” i kliknij „Zgadzam się i tworzę”.

6c49a874c48d0401.png

Ustaw nazwę agenta:

Agent

Ustaw cel:

Help user with questions about JIRA project

Instrukcje dotyczące zestawu:

- Greet the users, then ask how you can help them today.
- Summarize the user's request and ask them to confirm that you understood correctly.
  - If necessary, seek clarifying details.
- Thank the user for their business and say goodbye.

Kliknij „Zapisz”:

6ef0ca47100008e0.png

Przetestuj agenta, korzystając z czatu w emulatorze po prawej stronie:

32f49a9791302535.png

Otwórz menu Narzędzia i utwórz nowe narzędzie:

c236b95409dfedc3.png

W menu Typ wybierz OpenAPI.

Ustaw nazwę narzędzia:

jira-project-status

Opis zestawu:

Returns JIRA project status

Ustaw schemat (YAML) – zastąp adres URL TWOJEGO CLOUD RUN.

openapi: 3.0.0
info:
 title: CR API
 version: 1.0.0
 description: >-
   This is the OpenAPI specification of a service.
servers:
 - url: 'https://YOUR CLOUD RUN URL'
paths:
 /create-jira-issue:
   post:
     summary: Request impl
     operationId: create-jira-issue
     requestBody:
       description: Request impl
       required: true
       content:
         application/json:
           schema:
             $ref: '#/components/schemas/Prompt'
     responses:
       '200':
         description: Generated
         content:
           application/json:
             schema:
               type: string
 /generate:
   post:
     summary: Request impl
     operationId: generate
     requestBody:
       description: Request impl
       required: true
       content:
         application/json:
           schema:
             $ref: '#/components/schemas/Prompt'
     responses:
       '200':
         description: Generated
         content:
           application/json:
             schema:
               type: string

 /test:
   get:
     summary: Request impl
     operationId: test
     responses:
       '200':
         description: Generated
         content:
           application/json:
             schema:
               type: string                    
components:
 schemas:
   Prompt:
     type: object
     required:
       - prompt
     properties:
       prompt:
         type: string

Zapisz konfigurację narzędzia:

f99ce79ba79e3a4b.png

Aby użyć narzędzia, wróć do instrukcji konfiguracji i aktualizacji agenta:

Dodaj instrukcje korzystania z nowego narzędzia:

- Use ${TOOL: jira-project-status} to help the user with JIRA project status.

4dabf135b37b044b.png

Przejdź na kartę Przykłady i dodaj nowy przykład:

5b1fb22e49500362.png

Ustaw wyświetlaną nazwę:

jira-project-flow

Za pomocą menu na dole odtwórz rozmowę między użytkownikiem a obsługą klienta:

54ffb5e7744a0772.png

14cced6461a65811.png

Konfiguracja wywołania narzędzia:

82af695d2f21c4f0.png

Kliknij Zapisz i Anuluj. Wróć do emulatora agenta i przetestuj przepływ danych.

ec137f71bf6075e2.png

f76fd38c32e29f0a.png

Zapoznaj się ze sprawdzonymi metodami dotyczącymi agentów Vertex AI.

Ustawienia agenta

564dd5371999a3f1.png

b5b04f282fcee3e8.png

Ustawienia rejestrowania

af30487d72c1cfa2.png

Konfiguracja modelu.

53191049428693c7.png

Integracja z GitHubem do przesyłania i przywracania konfiguracji agenta.

7170649a9c027857.png

Elementy sterujące w emulatorze agenta:

59fd8b2343e89513.png

8. Integracja z Slackiem

Otwórz menu Integracje i kliknij „Połącz” na karcie Slack.

36f3992134479a37.png

e7ee0826668bfa2b.png

c3e36f4dacbe3f9b.png

Otwórz link i utwórz nową aplikację Slack na stronie https://api.slack.com/apps.

cbf13edc1b284899.png

W sekcji „Plik manifestu” wybierz:

64fa9c75afecdb3e.png

Wybieranie obszaru roboczego do tworzenia aplikacji

99a3d5b37cdf8f76.png

Przełącz się na format YAML i wklej ten plik manifestu:

display_information:
  name: Agent
  description: Agent
  background_color: "#1148b8"
features:
  app_home:
    home_tab_enabled: false
    messages_tab_enabled: true
    messages_tab_read_only_enabled: false
  bot_user:
    display_name: Agent
    always_online: true
oauth_config:
  scopes:
    bot:
      - app_mentions:read
      - chat:write
      - im:history
      - im:read
      - im:write
      - incoming-webhook
settings:
  event_subscriptions:
    request_url: https://dialogflow-slack-4vnhuutqka-uc.a.run.app
    bot_events:
      - app_mention
      - message.im
  org_deploy_enabled: false
  socket_mode_enabled: false
  token_rotation_enabled: false

Kliknij „Utwórz”:

5f0b3d2c44022eb9.png

Instalowanie w Workspace:

aa1c2ea1b700c838.png

Wybierz kanał „#general” i kliknij „Zezwól”.

18eba659946fc65f.png

W sekcji „Informacje podstawowe / Dane logowania do aplikacji” skopiuj „Podpis tajny” i ustaw go w integracji Slack.

31d62babb57e523d.png

bd9f7e3be3b9ea4e.png

Otwórz „OAuth i uprawnienia”, skopiuj „Token OAuth użytkownika bota” i ustaw go w integracji z Slackiem.

e74c7e003c31258.png

Wypełnij wymagane pola i kliknij „Rozpocznij”.

Wartość „Access Token” (Token dostępu) agenta to „Bot User OAUth Token” (Token autoryzacji użytkownika bota) z Slacka.

Wartość „tokenu podpisywania” agenta to „Signing Secret” (hasło do podpisywania) z Slacka.

a00d22bdaeed3ab8.png

7e71e37750fd063a.png

Skopiuj „URL webhooka” i wróć do konfiguracji aplikacji Slack.

Otwórz sekcję „Subskrypcje zdarzeń” i wklej adres URL.

a1e7271934c714d9.png

Zapisz zmiany.

e6d9b43b3787b6e7.png

Otwórz „Slack” i dodaj pracownika obsługi klienta, wpisując „@Pracownik obsługi klienta”.

Możesz na przykład dodać aplikację o nazwie „@CX”.

72313066707f947b.png

63becbd80824f8d8.png

c98e193062b096f0.png

Poproś pracownika obsługi klienta o podsumowanie projektu JIRA.

6edfdb74760548ad.png

9. Pytania i odpowiedzi dotyczące dokumentów PDF

Tworzenie zasobnika Cloud Storage

Otwórz GCS w konsoli Cloud: https://console.cloud.google.com/storage/browser

Utwórz nowy zasobnik.

W polu „Nazwa zasobnika” wpisz „pdf-docs” + 5 ostatnich cyfr nazwy projektu GCP.

Typ lokalizacji: multi-region, us.

Klasa miejsca na dane: Standard

Kontrola dostępu: Uniform

Ochrona danych: uncheck soft delete policy

Kliknij „Create”.

Potwierdź „Dostęp publiczny zostanie zablokowany”.

Pobierz raport PDF i prześlij go do zasobnika. https://services.google.com/fh/files/misc/exec_guide_gen_ai.pdf

Widok zasobnika z przesłanym plikiem:

ff09ac8da88fb680.png

Konfiguracja magazynu danych

Wróć do konsoli agenta i otwórz „Agent”, przewiń w dół i kliknij „+ Data store”.

e20b69db922e37d7.png

Użyj tych wartości:

Nazwa narzędzia: pdf-docs

Typ: Data store

Opis: pdf-docs

Kliknij „Save”.

c5bc7a2e458213ba.png

Kliknij „Create a data store” na dole strony.

Gdy pojawi się pytanie „Czy wyrażasz zgodę na przechowywanie Twoich magazynów danych wyszukiwania i rozmów w regionie Stany Zjednoczone?”, kliknij „AGREE”.

W polu „Podaj firmę” wpisz „Google”.

Na następnym ekranie kliknij „CREATE DATA STORE”.

Jako źródło danych wybierz „Cloud Storage”.

Przygotowywanie danych do pozyskania

https://cloud.google.com/generative-ai-app-builder/docs/prepare-data

Pliki HTML i TXT muszą mieć rozmiar nie większy niż 2,5 MB.

Pliki PDF, PPTX i DOCX muszą mieć rozmiar nieprzekraczający 100 MB.

Za jednym razem możesz zaimportować maksymalnie 100 tys. plików.

Wybierz: unstructured documents

Wybierz zasobnik lub folder w GCS.

e8534a921059e3a2.png

Kliknij Dalej: ed5ad1fabe9503a4.png

Nazwa typu magazynu danych: „pdf-docs”.

W menu kliknij „Digital parser”.

Włącz zaawansowany podział na fragmenty.

Włącz nagłówki elementów nadrzędnych we fragmentach.

Kliknij „Create”.

1a5222b86ee6c58e.png

3119b5fec43c9294.png

Wybierz magazyn danych i kliknij „Create”.

43d5be0a0aca6f8.png

9fd7fc7c1462d114.png

Kliknij magazyn danych i sprawdź dokumenty, aktywność i konfigurację przetwarzania.

872d9142615e90c9.png

Importowanie zajmie około 5–10 minut.

d9739a4af2244e03.png

Opcje analizowania i dzielenia na części

Możesz kontrolować analizowanie treści na te sposoby:

  • Parsowanie cyfrowe. Parser cyfrowy jest domyślnie włączony w przypadku wszystkich typów plików, chyba że zostanie określony inny typ parsera. Parser cyfrowy przetwarza przetworzone dokumenty, jeśli dla magazynu danych nie jest określony inny domyślny parsujący lub jeśli określony parsujący nie obsługuje typu pliku przetworzonego dokumentu.
  • Analiza OCR w przypadku plików PDF. Publiczna wersja przedpremierowa. Jeśli planujesz przesłać zeskanowane pliki PDF lub pliki PDF z tekstem w obrazach, możesz włączyć parsowanie OCR, aby ulepszyć indeksowanie plików PDF. Zapoznaj się z artykułem Informacje o parsowaniu OCR w przypadku plików PDF.
  • Parser układu. Publiczna wersja przedpremierowa. Jeśli planujesz korzystać z Vertex AI Search do wyszukiwania w plikach HTML, PDF lub DOCX, włącz parsowanie układu. Informacje o tym parsowaniu i sposobie jego włączenia znajdziesz w artykule Podział dokumentów na części w ramach RAG.

Więcej informacji o analizowaniu dokumentów i dzieleniu ich na fragmenty

Konfiguracja narzędzia

Wróć do karty z konfiguracją narzędzi.

Odśwież przeglądarkę i w menu Nieustrukturyzowane wybierz „pdf-docs”.

71323e788b35ca66.png

Skonfiguruj uziemienie.

Jako nazwę firmy wpisz „Google”.

Ustawienia ładunku – zaznacz „Include snippets in the response payload”.

b0cb701d13ad4264.png

Kliknij „Save”.

91a546957bdfe029.png

7535b85cfc7febe6.png

Konfiguracja instrukcji agenta

Wróć do konfiguracji agenta.

Dodawanie nowej instrukcji:

- Provide detailed answer to users questions about the exec guide to gen ai using information in the ${TOOL:pdf-docs}

9b9548497ddaccbd.png

Zapisz konfigurację.

Tworzenie przykładu dla narzędzia PDF-Docs

Przejdź na kartę Przykłady. Utwórz nowy przykład.

Używanie działań „+”:

4da93695907c97ad.png

Dodaj „Dane wejściowe użytkownika”:

What are the main capabilities?

Dodaj „Użycie narzędzia”.

  • Narzędzia i działanie: „pdf-docs

Dane wejściowe (requestBody)

{
  "query": "Main capabilities",
  "filter": "",
  "userMetadata": {},
  "fallback": ""
}

Dane wyjściowe narzędzia:

{
  "answer": "Detailed answer about main capabilities",
  "snippets": [
    {
      "uri": "https://storage.cloud.google.com/pdf-docs-49ca4/exec_guide_gen_ai.pdf",
      "text": "Detailed answer about main capabilities",
      "title": "exec_guide_gen_ai"
    }
  ]
}

Dodaj „Odpowiedź agenta”.

Detailed answer about main capabilities. 

https://storage.cloud.google.com/pdf-docs-49ca4/exec_guide_gen_ai.pdf

Przykład skonfigurowanej usługi:

2968363e05f3325e.png

Konfiguracja wywołania narzędzia:

658316bb29ac352d.png

Przetestuj konfigurację, wysyłając pytanie do agenta w emulatorze.

Pytanie:

What are the 10 steps in the exec guide?

5b2329c494ad0d17.png

Kliknij „Agent”, a potem „Save example”.

e79c86aa04a9572f.png

Podaj nazwę „user-question-flow” i zapisz.

Sformatuj odpowiedź agenta i dodaj link do dokumentu PDF z sekcji wyjściowej narzędzia.

50f2bcee082ac38d.png

Zapisz przykład.

Wróć do emulatora i kliknij „Replay conversation”. Sprawdź zaktualizowany format odpowiedzi.

8db40e424f448a2d.png

Zadaj kolejne pytanie:

What are the main capabilities in the exec guide?

6f103fdac8ec4cda.png

Źródłowy dokument PDF.

5b3e6d2ceda99247.png

Pytanie:

What should I consider when evaluating projects?

ec7e0f5884772385.png

Źródłowy dokument PDF.

57a0d331aa91f04b.png

Pytanie:

What are the priority use cases in Retail and CPG in the exec guide?

7a18ba3ca0fe90c5.png

Źródłowy dokument PDF.

b4d07e6e7d9adc00.png

10. Wstępnie utworzone agenty

W menu po lewej stronie sprawdź gotowe rozwiązania.

5720dc5343aede65.png

Wybierz jednego z agentów i wdróż go. Poznaj instrukcje i narzędzia do konfiguracji agenta.

2a3db1129b5a1461.png

11. Gratulacje!

Gratulacje! Masz ukończony ten moduł.

Omówione zagadnienia:

  • Wdrażanie aplikacji Cloud Run w celu integracji z interfejsami API Gemini
  • Tworzenie i wdrażanie agenta Vertex AI
  • Jak dodać integrację z Slackiem dla usługi Agent
  • Jak skonfigurować magazyn danych dla pytań i odpowiedzi w dokumentach PDF

Co dalej:

Czyszczenie danych

Aby uniknąć obciążenia konta Google Cloud opłatami za zasoby zużyte w tym samouczku, możesz usunąć projekt zawierający te zasoby lub zachować projekt i usunąć poszczególne zasoby.

Usuwanie projektu

Najprostszym sposobem na uniknięcie płatności jest usunięcie projektu utworzonego na potrzeby tego samouczka.

©2024 Google LLC. Wszelkie prawa zastrzeżone. Google i logo Google są znakami towarowymi Google LLC. Wszelkie inne nazwy firm i produktów mogą być znakami towarowymi odpowiednich podmiotów, z którymi są powiązane.