GenAI-Agent für die QA über Dokumente und API-Aufrufe

1. Übersicht

In diesem Lab erstellen Sie einen GenAI-Agenten, verbinden ihn mit der Cloud Run-Anwendung und integrieren ihn in den Slack-Arbeitsbereich.

8541c95a7fbc9be7.png

Lerninhalte

Das Lab besteht aus mehreren Hauptteilen:

  • Cloud Run-Anwendung für die Einbindung in Gemini APIs bereitstellen
  • Vertex AI-Agent erstellen und bereitstellen
  • Agent in Slack einbinden
  • Datenspeicher für Fragen und Antworten über PDF-Dokumente konfigurieren

Vorbereitung

  • Für dieses Lab wird davon ausgegangen, dass Sie mit der Cloud Console und Cloud Shell-Umgebungen vertraut sind.

2. Einrichtung und Anforderungen

Cloud-Projekt einrichten

  1. Melden Sie sich in der Google Cloud Console an und erstellen Sie ein neues Projekt oder verwenden Sie ein vorhandenes. Wenn Sie noch kein Gmail- oder Google Workspace-Konto haben, müssen Sie ein Konto erstellen.

fbef9caa1602edd0.png

a99b7ace416376c4.png

5e3ff691252acf41.png

  • Der Projektname ist der Anzeigename für die Teilnehmer dieses Projekts. Es ist ein Zeichenstring, der von Google APIs nicht verwendet wird. Sie können ihn jederzeit aktualisieren.
  • Die Projekt-ID ist für alle Google Cloud-Projekte eindeutig und kann nach der Festlegung nicht mehr geändert werden. In der Cloud Console wird automatisch ein eindeutiger String generiert. In der Regel spielt es keine Rolle, wie er lautet. In den meisten Codelabs müssen Sie auf Ihre Projekt-ID verweisen (normalerweise als PROJECT_ID gekennzeichnet). Wenn Ihnen die generierte ID nicht gefällt, können Sie eine andere zufällige generieren. Alternativ können Sie Ihr eigenes Konto ausprobieren und prüfen, ob es verfügbar ist. Sie kann nach diesem Schritt nicht mehr geändert werden und bleibt für die Dauer des Projekts bestehen.
  • Zur Information: Es gibt einen dritten Wert, die Projektnummer, die von einigen APIs verwendet wird. Weitere Informationen zu diesen drei Werten finden Sie in der Dokumentation.
  1. Als Nächstes müssen Sie die Abrechnung in der Cloud Console aktivieren, um Cloud-Ressourcen/-APIs verwenden zu können. Die Durchführung dieses Codelabs ist kostenlos oder kostet nur sehr wenig. Wenn Sie die Ressourcen herunterfahren möchten, um Kosten nach Abschluss dieser Anleitung zu vermeiden, können Sie die von Ihnen erstellten Ressourcen oder das Projekt löschen. Neuen Google Cloud-Nutzern steht das kostenlose Testprogramm mit einem Guthaben von 300$ zur Verfügung.

Umgebung einrichten

Öffnen Sie Gemini Chat.

e1e9ad314691368a.png

Cloud AI Companion API aktivieren:

66cb6e561e384bbf.png

Klicke auf „Start chatting“ und folge einer der Beispielfragen oder gib einen eigenen Prompt ein, um es auszuprobieren.

5482c153eef23126.png

Probiere folgende Prompts aus:

  • Erläutern Sie Cloud Run in fünf wichtigen Punkten.
  • Sie sind Product Manager für Google Cloud Run. Erläutern Sie einem Studenten Cloud Run in fünf kurzen Punkten.
  • Sie sind Produktmanager für Google Cloud Run und erklären einem zertifizierten Kubernetes-Entwickler Cloud Run in fünf kurzen Punkten.
  • Sie sind Product Manager für Google Cloud Run. Erläutern Sie einem leitenden Entwickler in fünf kurzen Punkten, wann Sie Cloud Run und wann Sie GKE verwenden würden.

Weitere Informationen zum Erstellen besserer Prompts finden Sie in der Anleitung: Prompts.

So verwendet Gemini for Google Cloud Ihre Daten

Selbstverpflichtung von Google zum Datenschutz

Google war einer der ersten Anbieter in der Branche, der eine KI-/ML-Datenschutzverpflichtung veröffentlicht hat. Diese legt fest, dass Kunden die höchste Sicherheit und Kontrolle über ihre Daten haben sollten, die in der Cloud gespeichert werden.

Von Ihnen eingereichte und empfangene Daten

Die Fragen, die Sie an Gemini stellen, einschließlich aller Eingabeinformationen oder Codes, die Sie zur Analyse oder Fertigstellung an Gemini senden, werden als Prompts bezeichnet. Die Antworten oder Code-Ergänzungen, die Sie von Gemini erhalten, werden als Antworten bezeichnet. Gemini verwendet Ihre Prompts und seine Antworten nicht als Daten zum Trainieren seines Modells.

Verschlüsselung von Prompts

Wenn Sie Prompts an Gemini senden, werden Ihre Daten während der Übertragung als Eingabe für das zugrunde liegende Modell in Gemini verschlüsselt.

Von Gemini generierte Programmdaten

Gemini wird mit Google Cloud-Code und ausgewähltem Code von Drittanbietern trainiert. Sie sind für die Sicherheit, die Tests und die Effektivität Ihres Codes verantwortlich, einschließlich aller Codevervollständigungen, -generierungen oder ‑analysen, die Gemini bietet.

Weitere Informationen zum Umgang von Google mit Prompts

3. Optionen zum Testen von Prompts

Es gibt mehrere Möglichkeiten, Prompts zu testen.

Vertex AI Studio ist Teil der Vertex AI-Plattform von Google Cloud und wurde speziell entwickelt, um die Entwicklung und Nutzung generativer KI-Modelle zu vereinfachen und zu beschleunigen.

Google AI Studio ist ein webbasiertes Tool zum Erstellen von Prototypen und Experimentieren mit Prompt-Engineering und der Gemini API.

Die Google Gemini Web-App (gemini.google.com) ist ein webbasiertes Tool, mit dem Sie die Leistungsfähigkeit der Gemini-KI-Modelle von Google kennenlernen und nutzen können.

4. Repository klonen

Kehren Sie zur Google Cloud Console zurück und aktivieren Sie Cloud Shell, indem Sie auf das Symbol rechts neben der Suchleiste klicken.

3e0c761ca41f315e.png

Führen Sie im geöffneten Terminal die folgenden Befehle aus:

git clone https://github.com/GoogleCloudPlatform/genai-for-developers.git

cd genai-for-developers

git checkout slack-agent-jira-lab

Klicken Sie auf „Editor öffnen“.

63e838aebfdd2423.png

Öffnen Sie über den Menüpunkt „File / Open Folder“ die Seite „genai-for-developers“.

e3b9bd9682acf539.png

Neues Terminal öffnen

62dccf5c78880ed9.png

5. Dienstkonto erstellen

Erstellen Sie ein neues Dienstkonto und Schlüssel.

Sie verwenden dieses Dienstkonto, um API-Aufrufe an die Vertex AI Gemini API aus der Cloud Run-Anwendung zu senden.

Konfigurieren Sie die Projektdetails mit den Projektdetails aus Qwiklabs.

Beispiel: qwiklabs-gcp-00-2c10937585bb

gcloud config set project YOUR_QWIKLABS_PROJECT_ID

Erstellen Sie ein Dienstkonto und gewähren Sie Rollen.

export LOCATION=us-central1
export PROJECT_ID=$(gcloud config get-value project)
export SERVICE_ACCOUNT_NAME='vertex-client'
export DISPLAY_NAME='Vertex Client'
export KEY_FILE_NAME='vertex-client-key'

gcloud iam service-accounts create $SERVICE_ACCOUNT_NAME --project $PROJECT_ID --display-name "$DISPLAY_NAME"

gcloud projects add-iam-policy-binding $PROJECT_ID --member="serviceAccount:$SERVICE_ACCOUNT_NAME@$PROJECT_ID.iam.gserviceaccount.com" --role="roles/aiplatform.admin"

gcloud projects add-iam-policy-binding $PROJECT_ID --member="serviceAccount:$SERVICE_ACCOUNT_NAME@$PROJECT_ID.iam.gserviceaccount.com" --role="roles/aiplatform.user"

gcloud projects add-iam-policy-binding $PROJECT_ID --member="serviceAccount:$SERVICE_ACCOUNT_NAME@$PROJECT_ID.iam.gserviceaccount.com" --role="roles/cloudbuild.builds.editor"

gcloud projects add-iam-policy-binding $PROJECT_ID --member="serviceAccount:$SERVICE_ACCOUNT_NAME@$PROJECT_ID.iam.gserviceaccount.com" --role="roles/artifactregistry.admin"

gcloud projects add-iam-policy-binding $PROJECT_ID --member="serviceAccount:$SERVICE_ACCOUNT_NAME@$PROJECT_ID.iam.gserviceaccount.com" --role="roles/storage.admin"

gcloud projects add-iam-policy-binding $PROJECT_ID --member="serviceAccount:$SERVICE_ACCOUNT_NAME@$PROJECT_ID.iam.gserviceaccount.com" --role="roles/run.admin"

gcloud projects add-iam-policy-binding $PROJECT_ID --member="serviceAccount:$SERVICE_ACCOUNT_NAME@$PROJECT_ID.iam.gserviceaccount.com" --role="roles/secretmanager.secretAccessor"


gcloud iam service-accounts keys create $KEY_FILE_NAME.json --iam-account=$SERVICE_ACCOUNT_NAME@$PROJECT_ID.iam.gserviceaccount.com

Wenn Sie zur Autorisierung aufgefordert werden, klicken Sie auf „Autorisieren“, um fortzufahren.

6356559df3eccdda.png

Aktivieren Sie die erforderlichen Dienste, um Vertex AI APIs und Gemini-Chat zu verwenden.

gcloud services enable \
    generativelanguage.googleapis.com \
    aiplatform.googleapis.com \
    cloudaicompanion.googleapis.com \
    run.googleapis.com \
    cloudresourcemanager.googleapis.com

Aktivieren Sie die erforderlichen Dienste, um Vertex AI APIs und Gemini-Chat zu verwenden.

gcloud services enable \
    artifactregistry.googleapis.com \
    cloudbuild.googleapis.com \
    runapps.googleapis.com \
    workstations.googleapis.com \
    servicemanagement.googleapis.com \
    secretmanager.googleapis.com \
    containerscanning.googleapis.com

Gemini Code Assist aktivieren

Klicken Sie auf das Gemini-Symbol und dann rechts unten auf Sign-in und Select Google Cloud project.

4a7f4640f66037f.png

8b4405d7366d2cad.png

bd07352707166136.png

Wählen Sie im Pop-up-Fenster Ihr Qwiklabs-Projekt aus.

Beispiel:

70ae6837db397e2a.png

Öffnen Sie die Datei „devai-api/app/routes.py“, klicken Sie mit der rechten Maustaste auf eine beliebige Stelle in der Datei und wählen Sie im Kontextmenü „Gemini Code Assist > Explain this"“ aus.

e54daef175df3cf0.png

Lesen Sie die Erklärung von Gemini für die ausgewählte Datei.

e666676dce8b94d6.png

6. Devai-API in Cloud Run bereitstellen

Prüfen Sie, ob Sie sich im richtigen Ordner befinden.

cd ~/genai-for-developers/devai-api

In diesem Lab folgen wir Best Practices und verwenden Secret Manager, um die Werte für das Zugriffstoken und den LangChain API-Schlüssel in Cloud Run zu speichern und zu referenzieren.

Umgebungsvariablen festlegen

export JIRA_API_TOKEN=your-jira-token
export JIRA_USERNAME="YOUR-EMAIL"
export JIRA_INSTANCE_URL="https://YOUR-JIRA-PROJECT.atlassian.net"
export JIRA_PROJECT_KEY="YOUR-JIRA-PROJECT-KEY"
export JIRA_CLOUD=true

export GITLAB_PERSONAL_ACCESS_TOKEN=your-gitlab-token
export GITLAB_URL="https://gitlab.com"
export GITLAB_BRANCH="devai"
export GITLAB_BASE_BRANCH="main"
export GITLAB_REPOSITORY="GITLAB-USERID/GITLAB-REPO"

export LANGCHAIN_API_KEY=your-langchain-key
export LANGCHAIN_TRACING_V2=true
export LANGCHAIN_ENDPOINT="https://api.smith.langchain.com"

Speichern Sie das JIRA-Zugriffstoken im Secret Manager.

echo -n $JIRA_API_TOKEN | \
 gcloud secrets create JIRA_API_TOKEN \
 --data-file=-

Speichern Sie das GitLab-Zugriffstoken in Secret Manager.

echo -n $GITLAB_PERSONAL_ACCESS_TOKEN | \
 gcloud secrets create GITLAB_PERSONAL_ACCESS_TOKEN \
 --data-file=-

Speichern Sie den LangChain API-Schlüssel im Secret Manager.

echo -n $LANGCHAIN_API_KEY | \
 gcloud secrets create LANGCHAIN_API_KEY \
 --data-file=-

Die Anwendung in Cloud Run bereitstellen.

gcloud run deploy devai-api \
  --source=. \
  --region="$LOCATION" \
  --allow-unauthenticated \
  --service-account vertex-client \
  --set-env-vars PROJECT_ID="$PROJECT_ID" \
  --set-env-vars LOCATION="$LOCATION" \
  --set-env-vars GITLAB_URL="$GITLAB_URL" \
  --set-env-vars GITLAB_REPOSITORY="$GITLAB_REPOSITORY" \
  --set-env-vars GITLAB_BRANCH="$GITLAB_BRANCH" \
  --set-env-vars GITLAB_BASE_BRANCH="$GITLAB_BASE_BRANCH" \
  --set-env-vars JIRA_USERNAME="$JIRA_USERNAME" \
  --set-env-vars JIRA_INSTANCE_URL="$JIRA_INSTANCE_URL" \
  --set-env-vars JIRA_PROJECT_KEY="$JIRA_PROJECT_KEY" \
  --set-env-vars JIRA_CLOUD="$JIRA_CLOUD" \
  --set-env-vars LANGCHAIN_TRACING_V2="$LANGCHAIN_TRACING_V2" \
  --update-secrets="LANGCHAIN_API_KEY=LANGCHAIN_API_KEY:latest" \
  --update-secrets="GITLAB_PERSONAL_ACCESS_TOKEN=GITLAB_PERSONAL_ACCESS_TOKEN:latest" \
  --update-secrets="JIRA_API_TOKEN=JIRA_API_TOKEN:latest" \
  --min-instances=1 \
  --max-instances=3

Geben Sie Y ein, um ein Artifact Registry-Docker-Repository zu erstellen.

Deploying from source requires an Artifact Registry Docker repository to store built containers. A repository named [cloud-run-source-deploy] in 
region [us-central1] will be created.

Do you want to continue (Y/n)?  y

Bitten Sie Gemini, den Befehl zu erklären:

94d5487568b08dd2.png

Sehen Sie sich unten den Ablauf für gcloud run deploy SERVICE_NAME --source=. an. Weitere Informationen

5c122a89dd11822e.png

Im Hintergrund verwendet dieser Befehl buildpacks und Cloud Build von Google Cloud, um automatisch Container-Images aus Ihrem Quellcode zu erstellen, ohne Docker auf Ihrem Computer installieren oder Buildpacks oder Cloud Build einrichten zu müssen. Das heißt, der einzige oben beschriebene Befehl würde die Befehle gcloud builds submit und gcloud run deploy ausführen.

Wenn Sie ein Dockerfile bereitgestellt haben(wie in diesem Repository), verwendet Cloud Build dieses, um Container-Images zu erstellen, anstatt sich auf die Buildpacks zu verlassen, die Container-Images automatisch erkennen und erstellen. Weitere Informationen zu Buildpacks finden Sie in der Dokumentation.

Sehen Sie sich die Cloud Build-Protokolle in der Console an.

Sehen Sie sich das erstellte Docker-Image in Artifact Registry an.

Öffnen Sie cloud-run-source-deploy/devai-api und prüfen Sie die automatisch erkannten Sicherheitslücken. Suchen Sie nach Problemen, für die Lösungen verfügbar sind, und lesen Sie die Beschreibung, um zu erfahren, wie Sie das Problem beheben können.

d00c9434b511be44.png

Sehen Sie sich die Cloud Run-Instanzdetails in der Cloud Console an.

Testen Sie den Endpunkt mit dem Befehl „curl“.

curl -X POST \
   -H "Content-Type: application/json" \
   -d '{"prompt": "PROJECT-100"}' \
   $(gcloud  run services list --filter="(devai-api)" --format="value(URL)")/generate

Ausgabe der Überprüfung:

bda86deaa1c449a8.png

7. Vertex AI Agent Builder

Suche nach „Agent Builder“ und öffne die App.

b99ae5b6ca1d6340.png

APIs aktivieren

4bf2b240bd51db8.png

Agent-Anwendung erstellen:

2e50007e454b504.png

Geben Sie „Kundenservicemitarbeiter“ als Anzeigenamen ein und klicken Sie auf „Zustimmen und erstellen“.

6c49a874c48d0401.png

Agentennamen festlegen:

Agent

Ziel festlegen:

Help user with questions about JIRA project

Anleitung zum Einrichten:

- Greet the users, then ask how you can help them today.
- Summarize the user's request and ask them to confirm that you understood correctly.
  - If necessary, seek clarifying details.
- Thank the user for their business and say goodbye.

Klicken Sie auf „Speichern“:

6ef0ca47100008e0.png

Testen Sie den Agenten über den Emulator-Chat auf der rechten Seite:

32f49a9791302535.png

Öffnen Sie das Menü „Tools“ und erstellen Sie ein neues Tool:

c236b95409dfedc3.png

Wählen Sie im Drop-down-Menü „Typ“ die Option OpenAPI aus.

Tool-Namen festlegen:

jira-project-status

Beschreibung des Sets:

Returns JIRA project status

Schema (YAML) festlegen – ersetzen Sie DEINE CLOUD RUN-URL.

openapi: 3.0.0
info:
 title: CR API
 version: 1.0.0
 description: >-
   This is the OpenAPI specification of a service.
servers:
 - url: 'https://YOUR CLOUD RUN URL'
paths:
 /create-jira-issue:
   post:
     summary: Request impl
     operationId: create-jira-issue
     requestBody:
       description: Request impl
       required: true
       content:
         application/json:
           schema:
             $ref: '#/components/schemas/Prompt'
     responses:
       '200':
         description: Generated
         content:
           application/json:
             schema:
               type: string
 /generate:
   post:
     summary: Request impl
     operationId: generate
     requestBody:
       description: Request impl
       required: true
       content:
         application/json:
           schema:
             $ref: '#/components/schemas/Prompt'
     responses:
       '200':
         description: Generated
         content:
           application/json:
             schema:
               type: string

 /test:
   get:
     summary: Request impl
     operationId: test
     responses:
       '200':
         description: Generated
         content:
           application/json:
             schema:
               type: string                    
components:
 schemas:
   Prompt:
     type: object
     required:
       - prompt
     properties:
       prompt:
         type: string

Speichern Sie die Toolkonfiguration:

f99ce79ba79e3a4b.png

Kehren Sie zur Agentkonfiguration zurück und aktualisieren Sie die Anleitung zur Verwendung des Tools:

Fügen Sie eine Anleitung zur Verwendung des neuen Tools hinzu:

- Use ${TOOL: jira-project-status} to help the user with JIRA project status.

4dabf135b37b044b.png

Wechseln Sie zum Tab „Beispiele“ und fügen Sie ein neues Beispiel hinzu:

5b1fb22e49500362.png

Legen Sie einen Anzeigenamen fest:

jira-project-flow

Modellieren Sie mit dem Menü unten die Unterhaltung zwischen Nutzer und Kundenservicemitarbeiter:

54ffb5e7744a0772.png

14cced6461a65811.png

Konfiguration der Toolausführung:

82af695d2f21c4f0.png

Klicken Sie auf „Speichern“ und dann auf „Abbrechen“. Kehren Sie zum Agent-Emulator zurück und testen Sie den Ablauf.

ec137f71bf6075e2.png

f76fd38c32e29f0a.png

Best Practices für Vertex AI-Agents

Agent-Einstellungen

564dd5371999a3f1.png

b5b04f282fcee3e8.png

Protokollierungseinstellungen

af30487d72c1cfa2.png

Modellkonfiguration

53191049428693c7.png

GitGub-Integration zum Pushen und Wiederherstellen der Agentkonfiguration

7170649a9c027857.png

Steuerelemente für den Kundenservicemitarbeiter-Emulator:

59fd8b2343e89513.png

8. Slack-Integration

Öffnen Sie das Menü „Integrationen“ und klicken Sie auf der Slack-Kachel auf „Verbinden“.

36f3992134479a37.png

e7ee0826668bfa2b.png

c3e36f4dacbe3f9b.png

Öffnen Sie den Link und erstellen Sie eine neue Slack-App unter https://api.slack.com/apps.

cbf13edc1b284899.png

Wähle unter „Manifest“ eine der folgenden Optionen aus:

64fa9c75afecdb3e.png

Arbeitsbereich für die Entwicklung Ihrer App auswählen

99a3d5b37cdf8f76.png

Wechseln Sie zu YAML und fügen Sie dieses Manifest ein:

display_information:
  name: Agent
  description: Agent
  background_color: "#1148b8"
features:
  app_home:
    home_tab_enabled: false
    messages_tab_enabled: true
    messages_tab_read_only_enabled: false
  bot_user:
    display_name: Agent
    always_online: true
oauth_config:
  scopes:
    bot:
      - app_mentions:read
      - chat:write
      - im:history
      - im:read
      - im:write
      - incoming-webhook
settings:
  event_subscriptions:
    request_url: https://dialogflow-slack-4vnhuutqka-uc.a.run.app
    bot_events:
      - app_mention
      - message.im
  org_deploy_enabled: false
  socket_mode_enabled: false
  token_rotation_enabled: false

Klicken Sie auf „Erstellen“:

5f0b3d2c44022eb9.png

In Workspace installieren:

aa1c2ea1b700c838.png

Wähle den Kanal „#general“ aus und klicke auf „Zulassen“.

18eba659946fc65f.png

Kopieren Sie unter „Allgemeine Informationen“ / „App-Anmeldedaten“ das „Signatur-Secret“ und legen Sie es in der Slack-Integration fest.

31d62babb57e523d.png

bd9f7e3be3b9ea4e.png

Öffnen Sie „OAuth und Berechtigungen“, kopieren Sie „OAuth-Token des Bot-Nutzers“ und legen Sie es in der Slack-Integration fest.

e74c7e003c31258.png

Legen Sie die erforderlichen Felder fest und klicken Sie auf „Starten“.

Der Wert für das Zugriffstoken des Kundenservicemitarbeiters ist das OAuth-Token des Bot-Nutzers aus Slack.

Der Wert für das Signaturtoken des Kundenservicemitarbeiters ist Signing Secret von Slack.

a00d22bdaeed3ab8.png

7e71e37750fd063a.png

Kopieren Sie die „Webhook-URL“ und kehren Sie zur Konfiguration der Slack-App zurück.

Öffnen Sie den Bereich „Ereignisabos“ und fügen Sie die URL ein.

a1e7271934c714d9.png

Speichern Sie die Änderungen.

e6d9b43b3787b6e7.png

Öffne „Slack“ und füge einen Kundenservicemitarbeiter hinzu, indem du „@Kundenservicemitarbeiter“ eingibst.

Beispiel: Sie fügen eine App mit dem Namen „@CX“ hinzu.

72313066707f947b.png

63becbd80824f8d8.png

c98e193062b096f0.png

Bitten Sie den Kundenservicemitarbeiter um eine JIRA-Projektübersicht.

6edfdb74760548ad.png

9. Fragen und Antworten zu PDF-Dokumenten

Cloud Storage-Bucket erstellen

Öffnen Sie GCS in der Cloud Console: https://console.cloud.google.com/storage/browser

Erstellen Sie einen neuen Bucket.

Geben Sie als Bucket-Namen „pdf-docs“ + die letzten fünf Ziffern Ihres GCP-Projekts ein.

Standorttyp: multi-region, us

Speicherklasse: Standard

Zugriffssteuerung: Uniform

Datenschutz: uncheck soft delete policy

Klicken Sie auf "Create".

Bestätigen Sie „Der öffentliche Zugriff wird verhindert“.

Laden Sie den PDF-Bericht herunter und laden Sie ihn in den Bucket hoch. https://services.google.com/fh/files/misc/exec_guide_gen_ai.pdf

Bucket mit hochgeladener Datei:

ff09ac8da88fb680.png

Datenspeicherkonfiguration

Kehren Sie zur Kundenservicekonsole zurück, öffnen Sie „Agent“, scrollen Sie nach unten und klicken Sie auf „+ Data store“.

e20b69db922e37d7.png

Verwenden Sie die folgenden Werte:

Tool name: pdf-docs

Typ: Data store

Beschreibung: pdf-docs

Klicken Sie auf „Save“.

c5bc7a2e458213ba.png

Klicken Sie unten auf der Seite auf das Dreipunkt-Menü Create a data store.

Klicken Sie auf AGREE, wenn Sie gefragt werden: „Sind Sie damit einverstanden, dass sich Ihre Datenspeicher von Search and Conversation in der Region USA befinden?“

Geben Sie im Feld „Unternehmen angeben“ die Tastenkombination „Google“ ein.

Klicken Sie auf dem nächsten Bildschirm auf CREATE DATA STORE.

Wählen Sie „Cloud Storage“ als Datenquelle aus.

Daten für die Aufnahme vorbereiten

https://cloud.google.com/generative-ai-app-builder/docs/prepare-data

HTML- und TXT-Dateien dürfen maximal 2,5 MB groß sein.

PDF-, PPTX- und DOCX-Dateien dürfen maximal 100 MB groß sein.

Sie können bis zu 100.000 Dateien gleichzeitig importieren.

Auswahlmöglichkeit: unstructured documents

Wählen Sie dann Ihren GCS-Bucket/-Ordner aus.

e8534a921059e3a2.png

Klicken Sie auf „Weiter“: ed5ad1fabe9503a4.png

Geben Sie für den Namen des Datenspeichers „pdf-docs“ ein.

Wählen Sie im Drop-down-Menü die Option „Digital parser“ aus.

Aktivieren Sie die erweiterte Blockierung.

Aktivieren Sie die Option „Ancestor-Überschriften in Blöcke aufnehmen“.

Klicken Sie auf "Create".

1a5222b86ee6c58e.png

3119b5fec43c9294.png

Wählen Sie den Datenspeicher aus und klicken Sie auf „Create“.

43d5be0a0aca6f8.png

9fd7fc7c1462d114.png

Klicken Sie auf den Datenspeicher und prüfen Sie die Dokumente, Aktivitäten und die Verarbeitungskonfiguration.

872d9142615e90c9.png

Der Import dauert etwa 5 bis 10 Minuten.

d9739a4af2244e03.png

Optionen für das Parsen und Chunking

Sie können das Parsen von Inhalten auf folgende Arten steuern:

  • Digitaler Parser Der digitale Parser ist standardmäßig für alle Dateitypen aktiviert, sofern kein anderer Parsertyp angegeben wird. Der digitale Parser verarbeitet aufgenommene Dokumente, wenn für den Datenspeicher kein anderer Standardparser angegeben ist oder der angegebene Parser den Dateityp eines aufgenommenen Dokuments nicht unterstützt.
  • OCR-Parsing für PDFs Öffentliche Vorschau. Wenn Sie gescannte PDFs oder PDFs mit Text in Bildern hochladen möchten, können Sie den OCR-Parser aktivieren, um die PDF-Indexierung zu verbessern. Weitere Informationen finden Sie unter OCR-Parsing für PDFs.
  • Layout-Parser Öffentliche Vorschau. Aktivieren Sie den Layout-Parser für HTML-, PDF- oder DOCX-Dateien, wenn Sie Vertex AI Search für RAG verwenden möchten. Informationen zu diesem Parser und dazu, wie Sie ihn aktivieren, finden Sie unter Dokumente für RAG in kleinere Abschnitte unterteilen.

Weitere Informationen zum Parsen und Aufteilen von Dokumenten

Toolkonfiguration

Kehren Sie zum Tab mit der Tools-Konfiguration zurück.

Aktualisieren Sie den Browser und wählen Sie im Drop-down-Menü „Unstrukturiert“ die Option „pdf-docs“ aus.

71323e788b35ca66.png

Erdung konfigurieren

Geben Sie „Google“ als Namen des Unternehmens ein.

Nutzlasteinstellungen – Häkchen bei „Include snippets in the response payload“ setzen

b0cb701d13ad4264.png

Klicken Sie auf "Save".

91a546957bdfe029.png

7535b85cfc7febe6.png

Konfiguration der Anleitung für Kundenservicemitarbeiter

Kehren Sie zur Agentkonfiguration zurück.

Neue Anleitung hinzufügen:

- Provide detailed answer to users questions about the exec guide to gen ai using information in the ${TOOL:pdf-docs}

9b9548497ddaccbd.png

Speichern Sie die Konfiguration.

Beispiel für das PDF-Docs-Tool erstellen

Wechseln Sie zum Tab „Beispiele“. Erstellen Sie ein neues Beispiel.

Aktionen vom Typ „+“ verwenden:

4da93695907c97ad.png

Fügen Sie „Nutzerinput“ hinzu:

What are the main capabilities?

Fügen Sie „Toolnutzung“ hinzu.

  • Tool und Aktion: „pdf-docs

Eingabe (requestBody)

{
  "query": "Main capabilities",
  "filter": "",
  "userMetadata": {},
  "fallback": ""
}

Tool-Ausgabe:

{
  "answer": "Detailed answer about main capabilities",
  "snippets": [
    {
      "uri": "https://storage.cloud.google.com/pdf-docs-49ca4/exec_guide_gen_ai.pdf",
      "text": "Detailed answer about main capabilities",
      "title": "exec_guide_gen_ai"
    }
  ]
}

„Kundenservicemitarbeiterantwort“ hinzufügen

Detailed answer about main capabilities. 

https://storage.cloud.google.com/pdf-docs-49ca4/exec_guide_gen_ai.pdf

Konfiguriertes Beispiel:

2968363e05f3325e.png

Konfiguration der Toolausführung:

658316bb29ac352d.png

Testen Sie die Konfiguration, indem Sie dem Kundenservicemitarbeiter im Emulator eine Frage senden.

Frage:

What are the 10 steps in the exec guide?

5b2329c494ad0d17.png

Wählen Sie „Agent“ aus und klicken Sie auf „Save example“.

e79c86aa04a9572f.png

Geben Sie den Namen „user-question-flow“ ein und speichern Sie die Datei.

Formatiere die Antwort des Kundenservicemitarbeiters und füge einen Link zum PDF-Dokument aus dem Tool-Ausgabebereich hinzu.

50f2bcee082ac38d.png

Speichern Sie das Beispiel.

Kehren Sie zum Emulator zurück und klicken Sie auf „Replay conversation“. Prüfen Sie das aktualisierte Antwortformat.

8db40e424f448a2d.png

Stellen Sie eine weitere Frage:

What are the main capabilities in the exec guide?

6f103fdac8ec4cda.png

Quell-PDF-Dokument

5b3e6d2ceda99247.png

Frage:

What should I consider when evaluating projects?

ec7e0f5884772385.png

Quell-PDF-Dokument

57a0d331aa91f04b.png

Frage:

What are the priority use cases in Retail and CPG in the exec guide?

7a18ba3ca0fe90c5.png

Quell-PDF-Dokument

b4d07e6e7d9adc00.png

10. Vordefinierte Agents

Im Menü auf der linken Seite finden Sie vordefinierte Bots.

5720dc5343aede65.png

Wählen Sie einen der Agenten aus und stellen Sie ihn bereit. Informationen zur Einrichtung, Anleitungen und Tools für Google Unternehmensprofil-Kundenservicemitarbeiter

2a3db1129b5a1461.png

11. Glückwunsch!

Sie haben das Lab erfolgreich abgeschlossen.

Behandelte Themen:

  • Cloud Run-Anwendung für die Einbindung in Gemini APIs bereitstellen
  • Vertex AI-Agent erstellen und bereitstellen
  • Slack-Integration für den Kundenservicemitarbeiter hinzufügen
  • Datenspeicher für Fragen und Antworten über PDF-Dokumente konfigurieren

Nächste Schritte:

Bereinigen

Damit Ihrem Google Cloud-Konto die in dieser Anleitung verwendeten Ressourcen nicht in Rechnung gestellt werden, können Sie entweder das Projekt löschen, das die Ressourcen enthält, oder das Projekt beibehalten und die einzelnen Ressourcen löschen.

Projekt löschen

Am einfachsten vermeiden Sie weitere Kosten durch Löschen des für die Anleitung erstellten Projekts.

© 2024 Google LLC. Alle Rechte vorbehalten. Google und das Google-Logo sind Marken von Google LLC. Alle anderen Unternehmens- und Produktnamen können Marken der jeweils mit ihnen verbundenen Unternehmen sein.