Agente GenAI per domande e risposte su documenti e azioni con chiamate API

1. Panoramica

In questo lab creerai un agente di IA generativa, lo collegherai all'applicazione Cloud Run e lo integrerai nello spazio di lavoro Slack.

8541c95a7fbc9be7.png

Cosa imparerai a fare

Il laboratorio è composto da diverse parti principali:

  • Esegui il deployment dell'applicazione Cloud Run per l'integrazione con le API Gemini
  • Crea e implementa l'agente conversazionale
  • Integrare l'agente in Slack
  • Configurare il data store per le domande e risposte sui documenti PDF

Prerequisiti

  • Questo lab presuppone familiarità con gli ambienti Cloud Console e Cloud Shell.

2. Configurazione e requisiti

Configurazione del progetto cloud

  1. Accedi alla console Google Cloud e crea un nuovo progetto o riutilizzane uno esistente. Se non hai ancora un account Gmail o Google Workspace, devi crearne uno.

fbef9caa1602edd0.png

a99b7ace416376c4.png

5e3ff691252acf41.png

  • Il nome del progetto è il nome visualizzato per i partecipanti al progetto. Si tratta di una stringa di caratteri non utilizzata dalle API di Google. Puoi sempre aggiornarlo.
  • L'ID progetto è univoco per tutti i progetti Google Cloud ed è immutabile (non può essere modificato dopo essere stato impostato). La console Cloud genera automaticamente una stringa univoca; di solito non ti interessa quale sia. Nella maggior parte dei codelab, dovrai fare riferimento al tuo ID progetto (in genere identificato come PROJECT_ID). Se l'ID generato non ti piace, puoi generarne un altro casuale. In alternativa, puoi provare il tuo e vedere se è disponibile. Non può essere modificato dopo questo passaggio e rimane invariato per tutta la durata del progetto.
  • Per tua informazione, esiste un terzo valore, un Numero progetto, utilizzato da alcune API. Scopri di più su tutti e tre questi valori nella documentazione.
  1. Successivamente, dovrai abilitare la fatturazione nella console Cloud per utilizzare le API/risorse Cloud. La partecipazione a questo codelab non ha costi, o quasi. Per arrestare le risorse ed evitare di incorrere in fatturazione al termine di questo tutorial, puoi eliminare le risorse che hai creato o il progetto. I nuovi utenti di Google Cloud sono idonei al programma Prova senza costi di 300$.

Configurazione dell'ambiente

Apri la chat di Gemini.

e1e9ad314691368a.png

Abilita l'API Gemini for Google Cloud:

990a0ceea7d05531.png

Fai clic su "Start chatting" e segui una delle domande di esempio o digita il tuo prompt per provarlo.

ed120d672468b412.png

Prompt da provare:

  • Spiega Cloud Run in 5 punti chiave.
  • Sei un Product Manager di Google Cloud Run e devi spiegare Cloud Run a uno studente in 5 brevi punti chiave.
  • Sei un Product Manager di Google Cloud Run e devi spiegare Cloud Run a uno sviluppatore Kubernetes certificato in 5 brevi punti chiave.
  • Sei un Product Manager di Google Cloud Run. Spiega a uno sviluppatore senior quando utilizzeresti Cloud Run rispetto a GKE in 5 brevi punti chiave.

Consulta la guida ai prompt per scoprire di più su come scrivere prompt migliori.

In che modo Gemini for Google Cloud utilizza i tuoi dati

Impegno di Google per la privacy

Google è stata una delle prime aziende del settore a pubblicare un impegno in materia di privacy AI/ML, che illustra la nostra convinzione che i clienti debbano disporre del massimo livello di sicurezza e controllo sui propri dati archiviati nel cloud.

Dati che invii e ricevi

Le domande che fai a Gemini, incluse le informazioni di input o il codice che invii a Gemini per l'analisi o il completamento, sono chiamate prompt. Le risposte o i completamenti di codice che ricevi da Gemini sono chiamati risposte. Gemini non utilizza i tuoi prompt o le relative risposte come dati per addestrare i propri modelli.

Crittografia dei prompt

Quando invii prompt a Gemini, i tuoi dati vengono criptati in transito come input al modello sottostante in Gemini.

Dati del programma generati da Gemini

Gemini viene addestrato sul codice proprietario di Google Cloud e su codice di terze parti selezionato. Sei responsabile della sicurezza, dei test e dell'efficacia del tuo codice, incluse eventuali operazioni di completamento, generazione o analisi del codice offerte da Gemini.

Scopri di più su come Google gestisce i tuoi prompt.

3. Opzioni per testare i prompt

Hai a disposizione diverse opzioni per testare i prompt.

Vertex AI Studio fa parte della piattaforma Vertex AI di Google Cloud, progettata specificamente per semplificare e accelerare lo sviluppo e l'utilizzo dei modelli di IA generativa.

Google AI Studio è uno strumento basato sul web per la prototipazione e la sperimentazione della progettazione di prompt e dell'API Gemini.

L'app web Google Gemini (gemini.google.com) è uno strumento basato sul web progettato per aiutarti a esplorare e utilizzare la potenza dei modelli di IA di Gemini di Google.

4. Clona il repository

Torna alla console Google Cloud e attiva Cloud Shell facendo clic sull'icona a destra della barra di ricerca.

3e0c761ca41f315e.png

Nel terminale aperto, esegui i seguenti comandi

git clone https://github.com/GoogleCloudPlatform/genai-for-developers.git

cd genai-for-developers

git checkout slack-agent-jira-lab

Fai clic su "Apri editor".

63e838aebfdd2423.png

Utilizzando l'elemento di menu "File / Open Folder", apri "genai-for-developers".

e3b9bd9682acf539.png

Aprire un nuovo terminale

4d9c41ab01ff4e97.png

5. Crea service account

Crea un nuovo account di servizio. Utilizzerai questo account di servizio per effettuare chiamate API all'API Vertex AI Gemini dall'applicazione Cloud Run.

Configura i dettagli del progetto utilizzando i dettagli del progetto Qwiklabs.

Esempio: qwiklabs-gcp-00-2c10937585bb

gcloud config set project YOUR_QWIKLABS_PROJECT_ID

Crea l'account di servizio e assegna i ruoli.

export LOCATION=us-central1
export PROJECT_ID=$(gcloud config get-value project)
export SERVICE_ACCOUNT_NAME='vertex-client'
export DISPLAY_NAME='Vertex Client'
export KEY_FILE_NAME='vertex-client-key'

gcloud iam service-accounts create $SERVICE_ACCOUNT_NAME --project $PROJECT_ID --display-name "$DISPLAY_NAME"

gcloud projects add-iam-policy-binding $PROJECT_ID --member="serviceAccount:$SERVICE_ACCOUNT_NAME@$PROJECT_ID.iam.gserviceaccount.com" --role="roles/aiplatform.admin"

gcloud projects add-iam-policy-binding $PROJECT_ID --member="serviceAccount:$SERVICE_ACCOUNT_NAME@$PROJECT_ID.iam.gserviceaccount.com" --role="roles/aiplatform.user"

gcloud projects add-iam-policy-binding $PROJECT_ID --member="serviceAccount:$SERVICE_ACCOUNT_NAME@$PROJECT_ID.iam.gserviceaccount.com" --role="roles/cloudbuild.builds.editor"

gcloud projects add-iam-policy-binding $PROJECT_ID --member="serviceAccount:$SERVICE_ACCOUNT_NAME@$PROJECT_ID.iam.gserviceaccount.com" --role="roles/artifactregistry.admin"

gcloud projects add-iam-policy-binding $PROJECT_ID --member="serviceAccount:$SERVICE_ACCOUNT_NAME@$PROJECT_ID.iam.gserviceaccount.com" --role="roles/storage.admin"

gcloud projects add-iam-policy-binding $PROJECT_ID --member="serviceAccount:$SERVICE_ACCOUNT_NAME@$PROJECT_ID.iam.gserviceaccount.com" --role="roles/run.admin"

gcloud projects add-iam-policy-binding $PROJECT_ID --member="serviceAccount:$SERVICE_ACCOUNT_NAME@$PROJECT_ID.iam.gserviceaccount.com" --role="roles/secretmanager.secretAccessor"

Se ti viene chiesto di autorizzare, fai clic su "Autorizza" per continuare.

6356559df3eccdda.png

Abilita i servizi richiesti per utilizzare le API Vertex AI e la chat Gemini.

gcloud services enable \
    generativelanguage.googleapis.com \
    aiplatform.googleapis.com \
    cloudaicompanion.googleapis.com \
    run.googleapis.com \
    cloudresourcemanager.googleapis.com

Abilita i servizi richiesti per utilizzare le API Vertex AI e la chat Gemini.

gcloud services enable \
    artifactregistry.googleapis.com \
    cloudbuild.googleapis.com \
    runapps.googleapis.com \
    workstations.googleapis.com \
    servicemanagement.googleapis.com \
    secretmanager.googleapis.com \
    containerscanning.googleapis.com

Utilizzare Gemini Code Assist per l'esplicazione del codice

Apri il file "devai-api/app/routes.py", fai clic con il tasto destro del mouse in un punto qualsiasi del file e seleziona "Gemini Code Assist > Explain this"" dal menu contestuale.

427ed40dd44cab8a.png

Esamina la spiegazione di Gemini per il file selezionato.

a286d1e85bc42960.png

6. Esegui il deployment di Devai-API in Cloud Run

Verifica di trovarti nella cartella corretta.

cd ~/genai-for-developers/devai-api

Per questo lab, seguiamo le best practice e utilizziamo Secret Manager per archiviare e fare riferimento ai valori del token di accesso e della chiave API LangChain in Cloud Run.

Imposta le variabili di ambiente. Esegui questo comando così com'è, senza modifiche.

export JIRA_API_TOKEN=your-jira-token
export JIRA_USERNAME="YOUR-EMAIL"
export JIRA_INSTANCE_URL="https://YOUR-JIRA-PROJECT.atlassian.net"
export JIRA_PROJECT_KEY="YOUR-JIRA-PROJECT-KEY"
export JIRA_CLOUD=true

export GITLAB_PERSONAL_ACCESS_TOKEN=your-gitlab-token
export GITLAB_URL="https://gitlab.com"
export GITLAB_BRANCH="devai"
export GITLAB_BASE_BRANCH="main"
export GITLAB_REPOSITORY="GITLAB-USERID/GITLAB-REPO"

export LANGCHAIN_API_KEY=your-langchain-key
export LANGCHAIN_TRACING_V2=true
export LANGCHAIN_ENDPOINT="https://api.smith.langchain.com"

Crea e archivia diversi secret in Secret Manager.

echo -n $JIRA_API_TOKEN | \
 gcloud secrets create JIRA_API_TOKEN \
 --data-file=-

echo -n $GITLAB_PERSONAL_ACCESS_TOKEN | \
 gcloud secrets create GITLAB_PERSONAL_ACCESS_TOKEN \
 --data-file=-

echo -n $LANGCHAIN_API_KEY | \
 gcloud secrets create LANGCHAIN_API_KEY \
 --data-file=-

Esegui il deployment dell'applicazione in Cloud Run.

gcloud run deploy devai-api \
  --source=. \
  --region="$LOCATION" \
  --allow-unauthenticated \
  --service-account vertex-client \
  --set-env-vars PROJECT_ID="$PROJECT_ID" \
  --set-env-vars LOCATION="$LOCATION" \
  --set-env-vars GITLAB_URL="$GITLAB_URL" \
  --set-env-vars GITLAB_REPOSITORY="$GITLAB_REPOSITORY" \
  --set-env-vars GITLAB_BRANCH="$GITLAB_BRANCH" \
  --set-env-vars GITLAB_BASE_BRANCH="$GITLAB_BASE_BRANCH" \
  --set-env-vars JIRA_USERNAME="$JIRA_USERNAME" \
  --set-env-vars JIRA_INSTANCE_URL="$JIRA_INSTANCE_URL" \
  --set-env-vars JIRA_PROJECT_KEY="$JIRA_PROJECT_KEY" \
  --set-env-vars JIRA_CLOUD="$JIRA_CLOUD" \
  --set-env-vars LANGCHAIN_TRACING_V2="$LANGCHAIN_TRACING_V2" \
  --update-secrets="LANGCHAIN_API_KEY=LANGCHAIN_API_KEY:latest" \
  --update-secrets="GITLAB_PERSONAL_ACCESS_TOKEN=GITLAB_PERSONAL_ACCESS_TOKEN:latest" \
  --update-secrets="JIRA_API_TOKEN=JIRA_API_TOKEN:latest" \
  --min-instances=1 \
  --max-instances=3

Rispondi Y per creare il repository Docker di Artifact Registry.

Deploying from source requires an Artifact Registry Docker repository to store built containers. A repository named [cloud-run-source-deploy] in 
region [us-central1] will be created.

Do you want to continue (Y/n)?  y

Chiedi a Gemini di spiegare il comando:

What does this command do?

gcloud run deploy devai-api \
  --source=. \
  --region="$LOCATION" \
  --allow-unauthenticated \
  --service-account vertex-client \
  --set-env-vars PROJECT_ID="$PROJECT_ID" \
  --set-env-vars LOCATION="$LOCATION" \
  --set-env-vars GITLAB_URL="$GITLAB_URL" \
  --set-env-vars GITLAB_REPOSITORY="$GITLAB_REPOSITORY" \
  --set-env-vars GITLAB_BRANCH="$GITLAB_BRANCH" \
  --set-env-vars GITLAB_BASE_BRANCH="$GITLAB_BASE_BRANCH" \
  --set-env-vars JIRA_USERNAME="$JIRA_USERNAME" \
  --set-env-vars JIRA_INSTANCE_URL="$JIRA_INSTANCE_URL" \
  --set-env-vars JIRA_PROJECT_KEY="$JIRA_PROJECT_KEY" \
  --set-env-vars JIRA_CLOUD="$JIRA_CLOUD" \
  --set-env-vars LANGCHAIN_TRACING_V2="$LANGCHAIN_TRACING_V2" \
  --update-secrets="LANGCHAIN_API_KEY=LANGCHAIN_API_KEY:latest" \
  --update-secrets="GITLAB_PERSONAL_ACCESS_TOKEN=GITLAB_PERSONAL_ACCESS_TOKEN:latest" \
  --update-secrets="JIRA_API_TOKEN=JIRA_API_TOKEN:latest" \
  --min-instances=1 \
  --max-instances=3

34ed504e0bcf697b.png

Esamina il flusso gcloud run deploy SERVICE_NAME --source=. di seguito. Scopri di più.

5c122a89dd11822e.png

Dietro le quinte, questo comando utilizza buildpacks e Cloud Build di Google Cloud per creare automaticamente immagini container dal codice sorgente senza dover installare Docker sulla tua macchina o configurare i buildpack o Cloud Build. In altre parole, il singolo comando descritto sopra esegue l'operazione che altrimenti richiederebbe i comandi gcloud builds submit e gcloud run deploy.

Se hai fornito il Dockerfile(come abbiamo fatto in questo repository), Cloud Build lo utilizzerà per creare immagini container anziché fare affidamento sui buildpack per rilevare e creare automaticamente le immagini container. Per scoprire di più sui buildpack, consulta la documentazione.

Esamina i log di Cloud Build nella console.

Esamina l'immagine Docker creata in Artifact Registry.

Esamina i dettagli dell'istanza Cloud Run in Cloud Console.

Testa l'endpoint eseguendo il comando curl.

curl -X POST \
   -H "Content-Type: application/json" \
   -d '{"prompt": "PROJECT-100"}' \
   $(gcloud  run services list --filter="(devai-api)" --format="value(URL)")/generate

La risposta sarà in formato markdown. Visualizzazione in modalità di anteprima per una migliore leggibilità.

bda86deaa1c449a8.png

7. Vertex AI Agent Builder

Cerca e apri "Agent Builder".

d189f2069d7bc7f6.png

Attiva le API:

4bf2b240bd51db8.png

Crea l'app agente conversazionale:

9ee179dbcca38234.png

Abilita l'API Dialogflow:

75f2fd509c16ab88.png

Seleziona il tuo progetto:

bf6d60bebab949fe.png

Fai clic su "Crea agente":

42332fe32af5a74e.png

Seleziona "Crea la tua".

583c747540ce3217.png

Digita "Agente" per il nome visualizzato e fai clic su "Crea".

e0056adc2f8af87.png

Imposta il nome del playbook:

Agent

Imposta obiettivo:

Help user with questions about JIRA project

Istruzioni per l'impostazione:

- Greet the users, then ask how you can help them today.
- Summarize the user's request and ask them to confirm that you understood correctly.
  - If necessary, seek clarifying details.
- Thank the user for their business and say goodbye.

Fai clic su "Salva":

bb2569de77cd1f06.png

Testa l'agente utilizzando la chat del simulatore sul lato destro:

7477cf320aaec22.png

66a7569835ebc7e7.png

Passa il mouse sopra l'icona a forma di chiave a sinistra. Apri il menu Strumenti e crea un nuovo strumento:

ff635e2d135ea6d8.png

Seleziona OpenAPI dal menu a discesa Tipo.

Imposta il nome dello strumento:

jira-project-status

Imposta descrizione:

Provides JIRA project status

Imposta Schema (YAML) - sostituisci IL TUO URL CLOUD RUN. Cambia scheda e controlla l'output della console per l'URL del servizio Cloud Run.

openapi: 3.0.0
info:
 title: CR API
 version: 1.0.0
 description: >-
   This is the OpenAPI specification of a service.
servers:
 - url: 'https://YOUR CLOUD RUN URL'
paths:

 /generate:
   post:
     summary: Request impl
     operationId: generate
     requestBody:
       description: Request impl
       required: true
       content:
         application/json:
           schema:
             $ref: '#/components/schemas/Prompt'
     responses:
       '200':
         description: Generated
         content:
           application/json:
             schema:
               $ref: '#/components/schemas/ProjectStatus'
                  
components:
 schemas:
   Prompt:
     type: object
     required:
       - prompt
     properties:
       prompt:
         type: string
   ProjectStatus:
     type: object
     required:
       - message
     properties:
       message:
         type: string

Salva la configurazione dello strumento:

ae78c21f48754d7a.png

Torna alla configurazione dell'agente selezionando "Playbook" dal menu a sinistra e aggiorna le istruzioni per utilizzare lo strumento:

Aggiungi le istruzioni per utilizzare il nuovo strumento e fai clic su "Salva":

- Use ${TOOL: jira-project-status} to help the user with JIRA project status.

4dabf135b37b044b.png

Passa alla scheda "Esempi" e aggiungi un nuovo esempio:

a74004679865ab6e.png

Imposta il nome visualizzato:

jira-project-flow

Utilizza il menu in basso per modellare la conversazione tra utente e agente:

Esempi di domande:

Risposta dell'agente: qual è l'ID progetto?

Input utente: TEST-PROJECT-100

Utilizzo dello strumento: jira-project-status

Risposta dell'agente: dettagli sullo stato del progetto.

6d54f90f1dc630fc.png

Utilizza il riferimento riportato di seguito per creare l'esempio.

c80eef4210256e5a.png

5affaee4cd54616e.png

Fai clic su Salva. Torna al simulatore di agenti e testa il flusso. Reimpostare le conversazioni esistenti.

f96e7f711561e559.png

85d0e12acf682357.png

Complimenti! Integrando gli strumenti collegati all'API di cui è stato eseguito il deployment su Cloud Run, hai consentito ad Agent di eseguire azioni.

695f18b4e5f81de8.png

Esamina le best practice per Vertex AI Agents

Esamina le impostazioni dell'agente disponibili

  • Impostazioni di logging: attiva Cloud Logging
  • Integrazione di Git: l'integrazione di Git ti consente di eseguire il push e il pull dell'agente da un repository Git.
  • Selezione del modello generativo
  • Limiti di token(input e output)

f914db1d8a5d5447.png

Esamina i controlli del simulatore dell'agente:

d1c4712603d4a8a2.png

8. Integrazione di Slack

Apri il menu Integrazioni e fai clic su "Connetti" nel riquadro di Slack.

6fc0ad95c28cb6c8.png

e7ee0826668bfa2b.png

b29574fd2a0f9725.png

Apri il link e crea una nuova app Slack all'indirizzo https://api.slack.com/apps

cbf13edc1b284899.png

Seleziona "Manifest":

7721feb295693ea2.png

Scegli uno spazio di lavoro per sviluppare la tua app

99a3d5b37cdf8f76.png

Passa a YAML e incolla questo manifest:

display_information:
  name: Agent
  description: Agent
  background_color: "#1148b8"
features:
  app_home:
    home_tab_enabled: false
    messages_tab_enabled: true
    messages_tab_read_only_enabled: false
  bot_user:
    display_name: Agent
    always_online: true
oauth_config:
  scopes:
    bot:
      - app_mentions:read
      - chat:write
      - im:history
      - im:read
      - im:write
      - incoming-webhook
settings:
  event_subscriptions:
    request_url: https://dialogflow-slack-4vnhuutqka-uc.a.run.app
    bot_events:
      - app_mention
      - message.im
  org_deploy_enabled: false
  socket_mode_enabled: false
  token_rotation_enabled: false

Fai clic su "Crea":

5f0b3d2c44022eb9.png

Installa in Workspace:

aa1c2ea1b700c838.png

Seleziona il canale "#general" e fai clic su "Consenti".

18eba659946fc65f.png

In "Informazioni di base / Credenziali app", copia "Signing Secret" e impostalo nell'integrazione di Slack dell'agente come valore per il campo "Signing Token".

31d62babb57e523d.png

bd9f7e3be3b9ea4e.png

Apri "OAuth e autorizzazioni ", copia"Token OAuth utente bot " e impostalo nell'integrazione di Slack dell'agente come valore per il campo "Token di accesso".

e74c7e003c31258.png

Imposta i campi obbligatori e fai clic su "Inizia".

Il valore "Access Token " dell'agente è "Token OAUth utente bot" di Slack.

Il valore "Token di firma " dell'agente è "Signing Secret" di Slack.

8ea9f6856efa62cf.png

7e71e37750fd063a.png

Copia "URL webhook" e torna alla configurazione dell'app Slack.

Apri la sezione "Iscrizioni agli eventi" e incolla l'URL.

a1e7271934c714d9.png

Salva le modifiche.

e6d9b43b3787b6e7.png

Apri "Slack" e aggiungi un agente digitando "@Agent".

Ad esempio, l'aggiunta di un'app con il nome "@CX".

72313066707f947b.png

63becbd80824f8d8.png

c98e193062b096f0.png

Chiedi all'agente un riepilogo del progetto JIRA.

6edfdb74760548ad.png

Complimenti! L'agente è stato integrato correttamente nello spazio di lavoro di Slack.

e1a792e199d697c7.png

9. Domande e risposte sui documenti PDF

Questa sezione illustra come creare un data store utilizzando un documento PDF e collegarlo all'agente, attivando la funzionalità D&R in base ai contenuti del documento.

Crea un bucket Cloud Storage

Apri Cloud Shell: https://shell.cloud.google.com/

Imposta il nome del bucket utilizzando le ultime 5 cifre del tuo progetto Google Cloud. Esempio: pdf-docs-3dw21

BUCKET_NAME=pdf-docs-LAST-5-DIGITS-OF-YOUR-PROJECT

Crea un bucket e carica un documento PDF.

gcloud storage buckets create gs://$BUCKET_NAME \
    --location=us \
    --default-storage-class=STANDARD \
    --no-public-access-prevention \
    --uniform-bucket-level-access

wget https://services.google.com/fh/files/misc/exec_guide_gen_ai.pdf 

gsutil cp exec_guide_gen_ai.pdf gs://$BUCKET_NAME

Configurazione del datastore

Torna alla console dell'agente e apri "Agent", scorri verso il basso e fai clic su "+ Data store".

9a5e4d6d1e040b86.png

Utilizza i seguenti valori:

Nome dello strumento: pdf-docs

Tipo: Data store

Descrizione: pdf-docs

Fai clic su "Save"

60096b1c597347fa.png

Fai clic su "Add data stores" in fondo alla pagina. A questo punto, fai clic su "Create new data store".

abb9e513ac905e75.png

Seleziona "Cloud Storage" come origine dati.

Seleziona: Unstructured documents

Seleziona il bucket/la cartella GCS.

42dec238c1d0ac2f.png

Seleziona "us" per la posizione del data store.

Per il tipo di nome dell'archivio dati: "pdf-docs"

Seleziona "Digital parser" dal menu a discesa.

Attiva il chunking avanzato.

Attiva le intestazioni dei predecessori nei chunk.

Fai clic su "Create".

1a5222b86ee6c58e.png

3119b5fec43c9294.png

Fai clic sul datastore ed esamina Documenti, Attività e Configurazione di elaborazione.

872d9142615e90c9.png

Il completamento dell'importazione richiede circa 5-10 minuti.

d9739a4af2244e03.png

Opzioni di analisi e suddivisione in blocchi

Puoi controllare l'analisi dei contenuti nei seguenti modi:

  • Parser digitale. Il parser digitale è attivo per impostazione predefinita per tutti i tipi di file, a meno che non venga specificato un tipo di parser diverso. L'analizzatore digitale elabora i documenti importati se non è specificato nessun altro analizzatore predefinito per l'archivio dati o se l'analizzatore specificato non supporta il tipo di file di un documento importato.
  • Analisi OCR per i PDF. Anteprima pubblica. Se prevedi di caricare PDF scansionati o PDF con testo all'interno delle immagini, puoi attivare l'analizzatore OCR per migliorare l'indicizzazione dei PDF. Consulta Informazioni sull'analisi dell'OCR per i PDF.
  • Parser del layout. Attiva l'analizzatore del layout per i file HTML, PDF o DOCX se prevedi di utilizzare Vertex AI Search per RAG. Per informazioni su questo parser e su come attivarlo, consulta Eseguire il chunking dei documenti per RAG.

Scopri di più sull'analisi e il chunking dei documenti .

Configurazione dello strumento

Torna alla schermata di configurazione dello strumento dell'agente e aggiorna i datastore disponibili.

Seleziona il datastore appena creato e fai clic su "Confirm".

2922f7d9bdb7b2bc.png

Configura la messa a terra.

Digita "Google Cloud" come nome dell'azienda.

Impostazioni del payload: seleziona "Include snippets in Conversational Messenger response payload"". Imposta il valore su 5.

Fai clic su "Salva".

484e99caa7d1bc07.png

Configurazione delle istruzioni dell'agente

Torna alla configurazione dell'agente.

Aggiungi una nuova istruzione:

- Provide detailed answer to users questions about the exec guide to gen ai using information in the ${TOOL:pdf-docs}

f6d27e58b68f9f7.png

Salva la configurazione.

Creare un esempio per lo strumento PDF-Docs

Passa alla scheda Esempi. Crea un nuovo esempio: Guide to generative AI

Utilizzo delle azioni "+":

ee4f85ba3f47fda0.png

Aggiungi "Input utente":

What are the main capabilities for generative AI?

Aggiungi "Utilizzo dello strumento".

  • Strumento e azione: "pdf-docs"

Input (requestBody)

{
  "query": "Main capabilities for generative AI",
  "filter": "",
  "userMetadata": {},
  "fallback": ""
}

Output dello strumento:

{
  "answer": "Detailed answer about main capabilities for generative AI",
  "snippets": [
    {
      "uri": "https://storage.cloud.google.com/pdf-docs-49ca4/exec_guide_gen_ai.pdf",
      "text": "Detailed answer about main capabilities",
      "title": "exec_guide_gen_ai"
    }
  ]
}

Aggiungi "Risposta dell'agente"

Detailed answer about main capabilities. 

https://storage.cloud.google.com/pdf-docs-49ca4/exec_guide_gen_ai.pdf

Esempio di configurazione:

d1da4c1d18709ea6.png

Configurazione dell'invocazione dello strumento:

a0d47a9dc04bb2f1.png

Passa al simulatore per testare la configurazione.

Domanda:

What are the 10 steps in the exec guide?

e682480a959125bc.png

Seleziona "Agent" dal menu a discesa Chiamate e fai clic su "Save as example".

582759df60b9a342.png

Fornisci un nome "user-question-flow".

Imposta il riepilogo: "Agent helped user answer question based on the pdf document" e fai clic su Salva.

Formatta la risposta dell'agente e includi il link al documento PDF dalla sezione di output dello strumento.

6ba5011ed26793f3.png

Salva l'esempio.

Torna al simulatore e fai clic su "Replay conversation". Controlla il formato della risposta aggiornato. Se visualizzi un errore dopo aver salvato l'esempio, potrebbe essere necessario aggiornare la finestra del browser e riavviare la conversazione inviando di nuovo il prompt:

What are the 10 steps in the exec guide?

51698c5f1fbd2770.png

Fai un'altra domanda:

What are the main capabilities in the exec guide?

7b636f489c05a13.png

Documento PDF di origine.

5b3e6d2ceda99247.png

Domanda:

What should I consider when evaluating projects?

1155edfbffcd14b2.png

Documento PDF di origine.

57a0d331aa91f04b.png

Domanda:

What are the priority use cases in Retail and CPG in the exec guide?

92264121fc8f06e.png

Documento PDF di origine.

b4d07e6e7d9adc00.png

Complimenti! Ora l'agente è in grado di fornire risposte fondate sui documenti PDF.

197cf1ae70663fae.png

10. Agenti predefiniti

A questo punto, esaminerai gli agenti predefiniti dal menu a sinistra.

de49672bbb8112fd.png

Seleziona uno degli agenti e esegui il deployment. Esplora la configurazione, le istruzioni e gli strumenti di Agent.

c2f1808c30d4c17b.png

11. Complimenti!

Complimenti, hai completato il lab.

Argomenti trattati:

  • Come creare e implementare gli agenti conversazionali
  • Come aggiungere lo strumento per l'agente supportato dall'applicazione Cloud Run
  • Come integrare l'agente nello spazio di lavoro di Slack
  • Come configurare il datastore per le domande e risposte sui documenti PDF

Passaggi successivi

Esegui la pulizia

Per evitare che al tuo account Google Cloud vengano addebitati costi relativi alle risorse utilizzate in questo tutorial, elimina il progetto che contiene le risorse oppure mantieni il progetto ed elimina le singole risorse.

Elimina il progetto

Il modo più semplice per eliminare la fatturazione è eliminare il progetto che hai creato per il tutorial.

©2024 Google LLC. Tutti i diritti riservati. Google e il logo Google sono marchi di Google LLC. Tutti gli altri nomi di società e prodotti sono marchi delle rispettive società a cui sono associati.