Agente de GenAI para el control de calidad de documentos y llamadas a la API

1. Descripción general

En este lab, crearás un agente de GenAI, lo conectarás a la aplicación de Cloud Run y lo integrarás en el espacio de trabajo de Slack.

8541c95a7fbc9be7.png

Qué aprenderás

El lab tiene varias partes principales:

  • Implementa la aplicación de Cloud Run para integrarla con las APIs de Gemini
  • Crea e implementa el agente de Vertex AI
  • Cómo integrar el agente en Slack
  • Configura el almacén de datos para preguntas y respuestas en documentos PDF

Requisitos previos

  • Para este lab, se da por sentado que el usuario tiene conocimientos previos sobre los entornos de shell y la consola de Cloud.

2. Configuración y requisitos

Configuración del proyecto de Cloud

  1. Accede a Google Cloud Console y crea un proyecto nuevo o reutiliza uno existente. Si aún no tienes una cuenta de Gmail o de Google Workspace, debes crear una.

fbef9caa1602edd0.png

a99b7ace416376c4.png

5e3ff691252acf41.png

  • El Nombre del proyecto es el nombre visible de los participantes de este proyecto. Es una cadena de caracteres que no se utiliza en las APIs de Google. Puedes actualizarla cuando quieras.
  • El ID del proyecto es único en todos los proyectos de Google Cloud y es inmutable (no se puede cambiar después de configurarlo). La consola de Cloud genera automáticamente una cadena única. Por lo general, no importa cuál sea. En la mayoría de los codelabs, deberás hacer referencia al ID de tu proyecto (suele identificarse como PROJECT_ID). Si no te gusta el ID que se generó, podrías generar otro aleatorio. También puedes probar uno propio y ver si está disponible. No se puede cambiar después de este paso y se usa el mismo durante todo el proyecto.
  • Recuerda que hay un tercer valor, un número de proyecto, que usan algunas APIs. Obtén más información sobre estos tres valores en la documentación.
  1. A continuación, deberás habilitar la facturación en la consola de Cloud para usar las APIs o los recursos de Cloud. Ejecutar este codelab no costará mucho, tal vez nada. Para cerrar recursos y evitar que se generen cobros más allá de este instructivo, puedes borrar los recursos que creaste o borrar el proyecto. Los usuarios nuevos de Google Cloud son aptos para participar en el programa Prueba gratuita de $300.

Configuración del entorno

Abre el chat de Gemini.

e1e9ad314691368a.png

Habilita la API de Cloud AI Companion:

66cb6e561e384bbf.png

Haz clic en "Start chatting" y sigue una de las preguntas de ejemplo o escribe tu propia instrucción para probarla.

5482c153eef23126.png

Instrucciones que puedes probar:

  • Explica Cloud Run en 5 puntos clave.
  • Eres el gerente de producto de Google Cloud Run y debes explicarle Cloud Run a un estudiante en 5 puntos clave breves.
  • Eres gerente de producto de Google Cloud Run y le explicas Cloud Run a un desarrollador certificado de Kubernetes en 5 puntos clave breves.
  • Eres gerente de producto de Google Cloud Run y debes explicarle a un desarrollador sénior cuándo usarías Cloud Run en lugar de GKE en 5 puntos clave breves.

Consulta la Guía de instrucciones para obtener más información sobre cómo escribir mejores instrucciones.

Cómo Gemini para Google Cloud usa tus datos

Compromiso de privacidad de Google

Google fue uno de los primeros en el sector en publicar un compromiso de privacidad con la IA y el AA, que describe nuestra creencia de que los clientes deben tener el nivel más alto de seguridad y control sobre sus datos que se almacenan en la nube.

Datos que envías y recibes

Las preguntas que le haces a Gemini, incluida la información de entrada o el código que le envías para que las analice o complete, se denominan instrucciones. Las respuestas o las terminaciones de código que recibes de Gemini se denominan respuestas. Gemini no usa tus instrucciones ni sus respuestas como datos para entrenar sus modelos.

Encriptación de instrucciones

Cuando envías instrucciones a Gemini, tus datos se encriptan en tránsito como entrada al modelo subyacente en Gemini.

Datos de programas generados a partir de Gemini

Gemini se entrena con código propio de Google Cloud y código de terceros seleccionado. Eres responsable de la seguridad, las pruebas y la eficacia de tu código, incluidos cualquier finalización, generación o análisis de código que te ofrezca Gemini.

Obtén más información sobre cómo Google maneja tus instrucciones.

3. Opciones para probar instrucciones

Tienes varias opciones para probar las instrucciones.

Vertex AI Studio es parte de la plataforma Vertex AI de Google Cloud, diseñada específicamente para simplificar y acelerar el desarrollo y el uso de modelos de IA generativa.

Google AI Studio es una herramienta basada en la Web para crear prototipos y experimentar con la ingeniería de instrucciones y la API de Gemini.

La app web de Google Gemini (gemini.google.com) es una herramienta basada en la Web diseñada para ayudarte a explorar y aprovechar el poder de los modelos de IA de Gemini de Google.

4. Clone el repositorio

Regresa a la consola de Google Cloud y activa Cloud Shell haciendo clic en el ícono que se encuentra a la derecha de la barra de búsqueda.

3e0c761ca41f315e.png

En la terminal abierta, ejecuta los siguientes comandos:

git clone https://github.com/GoogleCloudPlatform/genai-for-developers.git

cd genai-for-developers

git checkout slack-agent-jira-lab

Haz clic en "Open Editor".

63e838aebfdd2423.png

En el elemento de menú “File / Open Folder”, abre “genai-for-developers”.

e3b9bd9682acf539.png

Abre una terminal nueva

62dccf5c78880ed9.png

5. Crear una cuenta de servicio.

Crea una cuenta de servicio y claves nuevas.

Usarás esta cuenta de servicio para realizar llamadas a la API de Gemini de Vertex AI desde la aplicación de Cloud Run.

Configura los detalles del proyecto con los detalles de tu proyecto de Qwiklabs.

Ejemplo: qwiklabs-gcp-00-2c10937585bb

gcloud config set project YOUR_QWIKLABS_PROJECT_ID

Crea una cuenta de servicio y otorga roles.

export LOCATION=us-central1
export PROJECT_ID=$(gcloud config get-value project)
export SERVICE_ACCOUNT_NAME='vertex-client'
export DISPLAY_NAME='Vertex Client'
export KEY_FILE_NAME='vertex-client-key'

gcloud iam service-accounts create $SERVICE_ACCOUNT_NAME --project $PROJECT_ID --display-name "$DISPLAY_NAME"

gcloud projects add-iam-policy-binding $PROJECT_ID --member="serviceAccount:$SERVICE_ACCOUNT_NAME@$PROJECT_ID.iam.gserviceaccount.com" --role="roles/aiplatform.admin"

gcloud projects add-iam-policy-binding $PROJECT_ID --member="serviceAccount:$SERVICE_ACCOUNT_NAME@$PROJECT_ID.iam.gserviceaccount.com" --role="roles/aiplatform.user"

gcloud projects add-iam-policy-binding $PROJECT_ID --member="serviceAccount:$SERVICE_ACCOUNT_NAME@$PROJECT_ID.iam.gserviceaccount.com" --role="roles/cloudbuild.builds.editor"

gcloud projects add-iam-policy-binding $PROJECT_ID --member="serviceAccount:$SERVICE_ACCOUNT_NAME@$PROJECT_ID.iam.gserviceaccount.com" --role="roles/artifactregistry.admin"

gcloud projects add-iam-policy-binding $PROJECT_ID --member="serviceAccount:$SERVICE_ACCOUNT_NAME@$PROJECT_ID.iam.gserviceaccount.com" --role="roles/storage.admin"

gcloud projects add-iam-policy-binding $PROJECT_ID --member="serviceAccount:$SERVICE_ACCOUNT_NAME@$PROJECT_ID.iam.gserviceaccount.com" --role="roles/run.admin"

gcloud projects add-iam-policy-binding $PROJECT_ID --member="serviceAccount:$SERVICE_ACCOUNT_NAME@$PROJECT_ID.iam.gserviceaccount.com" --role="roles/secretmanager.secretAccessor"


gcloud iam service-accounts keys create $KEY_FILE_NAME.json --iam-account=$SERVICE_ACCOUNT_NAME@$PROJECT_ID.iam.gserviceaccount.com

Si se te solicita autorización, haz clic en "Autorizar" para continuar.

6356559df3eccdda.png

Habilita los servicios necesarios para usar las APIs de Vertex AI y el chat de Gemini.

gcloud services enable \
    generativelanguage.googleapis.com \
    aiplatform.googleapis.com \
    cloudaicompanion.googleapis.com \
    run.googleapis.com \
    cloudresourcemanager.googleapis.com

Habilita los servicios necesarios para usar las APIs de Vertex AI y el chat de Gemini.

gcloud services enable \
    artifactregistry.googleapis.com \
    cloudbuild.googleapis.com \
    runapps.googleapis.com \
    workstations.googleapis.com \
    servicemanagement.googleapis.com \
    secretmanager.googleapis.com \
    containerscanning.googleapis.com

Habilita Gemini Code Assist

Haz clic en el ícono de "Gemini", en la esquina inferior derecha, haz clic en "Sign-in" y, luego, en "Select Google Cloud project".

4a7f4640f66037f.png

8b4405d7366d2cad.png

bd07352707166136.png

En la ventana emergente, selecciona tu proyecto de Qwiklabs.

Ejemplo:

70ae6837db397e2a.png

Abre el archivo "devai-api/app/routes.py" y, luego, haz clic con el botón derecho en cualquier parte del archivo y selecciona "Gemini Code Assist > Explain this" en el menú contextual.

e54daef175df3cf0.png

Revisa la explicación de Gemini para el archivo seleccionado.

e666676dce8b94d6.png

6. Implementa Devai-API en Cloud Run

Verifica que estés en la carpeta correcta.

cd ~/genai-for-developers/devai-api

En este lab, seguimos las prácticas recomendadas y usamos Secret Manager para almacenar y hacer referencia a los valores del token de acceso y la clave de API de LangChain en Cloud Run.

Configurar variables de entorno

export JIRA_API_TOKEN=your-jira-token
export JIRA_USERNAME="YOUR-EMAIL"
export JIRA_INSTANCE_URL="https://YOUR-JIRA-PROJECT.atlassian.net"
export JIRA_PROJECT_KEY="YOUR-JIRA-PROJECT-KEY"
export JIRA_CLOUD=true

export GITLAB_PERSONAL_ACCESS_TOKEN=your-gitlab-token
export GITLAB_URL="https://gitlab.com"
export GITLAB_BRANCH="devai"
export GITLAB_BASE_BRANCH="main"
export GITLAB_REPOSITORY="GITLAB-USERID/GITLAB-REPO"

export LANGCHAIN_API_KEY=your-langchain-key
export LANGCHAIN_TRACING_V2=true
export LANGCHAIN_ENDPOINT="https://api.smith.langchain.com"

Almacena el token de acceso de JIRA en Secret Manager.

echo -n $JIRA_API_TOKEN | \
 gcloud secrets create JIRA_API_TOKEN \
 --data-file=-

Almacena el token de acceso de GitLab en Secret Manager.

echo -n $GITLAB_PERSONAL_ACCESS_TOKEN | \
 gcloud secrets create GITLAB_PERSONAL_ACCESS_TOKEN \
 --data-file=-

Almacena la clave de API de LangChain en Secret Manager.

echo -n $LANGCHAIN_API_KEY | \
 gcloud secrets create LANGCHAIN_API_KEY \
 --data-file=-

Implementa la aplicación en Cloud Run.

gcloud run deploy devai-api \
  --source=. \
  --region="$LOCATION" \
  --allow-unauthenticated \
  --service-account vertex-client \
  --set-env-vars PROJECT_ID="$PROJECT_ID" \
  --set-env-vars LOCATION="$LOCATION" \
  --set-env-vars GITLAB_URL="$GITLAB_URL" \
  --set-env-vars GITLAB_REPOSITORY="$GITLAB_REPOSITORY" \
  --set-env-vars GITLAB_BRANCH="$GITLAB_BRANCH" \
  --set-env-vars GITLAB_BASE_BRANCH="$GITLAB_BASE_BRANCH" \
  --set-env-vars JIRA_USERNAME="$JIRA_USERNAME" \
  --set-env-vars JIRA_INSTANCE_URL="$JIRA_INSTANCE_URL" \
  --set-env-vars JIRA_PROJECT_KEY="$JIRA_PROJECT_KEY" \
  --set-env-vars JIRA_CLOUD="$JIRA_CLOUD" \
  --set-env-vars LANGCHAIN_TRACING_V2="$LANGCHAIN_TRACING_V2" \
  --update-secrets="LANGCHAIN_API_KEY=LANGCHAIN_API_KEY:latest" \
  --update-secrets="GITLAB_PERSONAL_ACCESS_TOKEN=GITLAB_PERSONAL_ACCESS_TOKEN:latest" \
  --update-secrets="JIRA_API_TOKEN=JIRA_API_TOKEN:latest" \
  --min-instances=1 \
  --max-instances=3

Responde Y para crear el repositorio de Docker de Artifact Registry.

Deploying from source requires an Artifact Registry Docker repository to store built containers. A repository named [cloud-run-source-deploy] in 
region [us-central1] will be created.

Do you want to continue (Y/n)?  y

Pídele a Gemini que explique el comando:

94d5487568b08dd2.png

Revisa el flujo de gcloud run deploy SERVICE_NAME --source=. a continuación. Obtén más información.

5c122a89dd11822e.png

En segundo plano, este comando usa buildpacks y Cloud Build de Google Cloud para compilar automáticamente imágenes de contenedor a partir del código fuente sin tener que instalar Docker en tu máquina ni configurar los paquetes de compilación o Cloud Build. Es decir, el comando único descrito anteriormente hace lo que requeriría el uso de los comandos gcloud builds submit y gcloud run deploy.

Si proporcionaste un Dockerfile(como lo hicimos en este repositorio), Cloud Build lo usará para compilar imágenes de contenedores en lugar de depender de los paquetes de compilación para detectar e implementar imágenes de contenedores automáticamente. Para obtener más información sobre los paquetes de compilación, consulta la documentación.

Revisa los registros de Cloud Build en Console.

Revisa la imagen de Docker creada en Artifact Registry.

Abre cloud-run-source-deploy/devai-api y revisa las vulnerabilidades que se detectaron automáticamente. Revisa los que tienen correcciones disponibles y consulta cómo se pueden solucionar según la descripción.

d00c9434b511be44.png

Revisa los detalles de la instancia de Cloud Run en la consola de Cloud.

Ejecuta el comando curl para probar el extremo.

curl -X POST \
   -H "Content-Type: application/json" \
   -d '{"prompt": "PROJECT-100"}' \
   $(gcloud  run services list --filter="(devai-api)" --format="value(URL)")/generate

Revisa el resultado:

bda86deaa1c449a8.png

7. Vertex AI Agent Builder

Busca y abre "Agent Builder".

b99ae5b6ca1d6340.png

Activa API

4bf2b240bd51db8.png

Crea una app de agente:

2e50007e454b504.png

Escribe "Agente" en Nombre visible y haz clic en "Aceptar y crear".

6c49a874c48d0401.png

Establece el nombre del agente:

Agent

Establecer objetivo:

Help user with questions about JIRA project

Instrucciones de configuración:

- Greet the users, then ask how you can help them today.
- Summarize the user's request and ask them to confirm that you understood correctly.
  - If necessary, seek clarifying details.
- Thank the user for their business and say goodbye.

Haz clic en "Guardar":

6ef0ca47100008e0.png

Prueba el agente con el chat del emulador en el lado derecho:

32f49a9791302535.png

Abre el menú Herramientas y crea una nueva herramienta:

c236b95409dfedc3.png

Selecciona OpenAPI en el menú desplegable Tipo.

Establece el nombre de la herramienta:

jira-project-status

Descripción del conjunto:

Returns JIRA project status

Establece el esquema (YAML): reemplaza TU URL DE CLOUD RUN.

openapi: 3.0.0
info:
 title: CR API
 version: 1.0.0
 description: >-
   This is the OpenAPI specification of a service.
servers:
 - url: 'https://YOUR CLOUD RUN URL'
paths:
 /create-jira-issue:
   post:
     summary: Request impl
     operationId: create-jira-issue
     requestBody:
       description: Request impl
       required: true
       content:
         application/json:
           schema:
             $ref: '#/components/schemas/Prompt'
     responses:
       '200':
         description: Generated
         content:
           application/json:
             schema:
               type: string
 /generate:
   post:
     summary: Request impl
     operationId: generate
     requestBody:
       description: Request impl
       required: true
       content:
         application/json:
           schema:
             $ref: '#/components/schemas/Prompt'
     responses:
       '200':
         description: Generated
         content:
           application/json:
             schema:
               type: string

 /test:
   get:
     summary: Request impl
     operationId: test
     responses:
       '200':
         description: Generated
         content:
           application/json:
             schema:
               type: string                    
components:
 schemas:
   Prompt:
     type: object
     required:
       - prompt
     properties:
       prompt:
         type: string

Guarda la configuración de la herramienta:

f99ce79ba79e3a4b.png

Regresa a la configuración del agente y actualiza las instrucciones para usar la herramienta:

Agrega instrucciones para usar la nueva herramienta:

- Use ${TOOL: jira-project-status} to help the user with JIRA project status.

4dabf135b37b044b.png

Cambia a la pestaña Ejemplos y agrega un ejemplo nuevo:

5b1fb22e49500362.png

Establece el nombre visible:

jira-project-flow

Con el menú de la parte inferior, modela la conversación entre el usuario y el agente:

54ffb5e7744a0772.png

14cced6461a65811.png

Configuración de invocación de herramientas:

82af695d2f21c4f0.png

Haz clic en Guardar y Cancelar. Regresa al emulador de agentes y prueba el flujo.

ec137f71bf6075e2.png

f76fd38c32e29f0a.png

Revisa las prácticas recomendadas para los agentes de Vertex AI.

Configuración del agente

564dd5371999a3f1.png

b5b04f282fcee3e8.png

Configuración de registros

af30487d72c1cfa2.png

Configuración del modelo.

53191049428693c7.png

Integración de GitGub para enviar y restablecer la configuración del agente.

7170649a9c027857.png

Controles del emulador de agentes:

59fd8b2343e89513.png

8. Integración de Slack

Abre el menú Integrations y haz clic en “Connect” en la tarjeta de Slack.

36f3992134479a37.png

e7ee0826668bfa2b.png

c3e36f4dacbe3f9b.png

Abre el vínculo y crea una app de Slack nueva en https://api.slack.com/apps.

cbf13edc1b284899.png

Selecciona una opción de "Manifiesto":

64fa9c75afecdb3e.png

Elige un espacio de trabajo para desarrollar tu app

99a3d5b37cdf8f76.png

Cambia a YAML y pega este manifiesto:

display_information:
  name: Agent
  description: Agent
  background_color: "#1148b8"
features:
  app_home:
    home_tab_enabled: false
    messages_tab_enabled: true
    messages_tab_read_only_enabled: false
  bot_user:
    display_name: Agent
    always_online: true
oauth_config:
  scopes:
    bot:
      - app_mentions:read
      - chat:write
      - im:history
      - im:read
      - im:write
      - incoming-webhook
settings:
  event_subscriptions:
    request_url: https://dialogflow-slack-4vnhuutqka-uc.a.run.app
    bot_events:
      - app_mention
      - message.im
  org_deploy_enabled: false
  socket_mode_enabled: false
  token_rotation_enabled: false

Haz clic en “Crear”:

5f0b3d2c44022eb9.png

Instalar en Workspace:

aa1c2ea1b700c838.png

Selecciona el canal "#general" y haz clic en "Permitir".

18eba659946fc65f.png

En "Información básica / Credenciales de la app", copia "Secreto de firma" y configúralo en la integración de Slack.

31d62babb57e523d.png

bd9f7e3be3b9ea4e.png

Abre "OAuth y permisos", copia "Token de OAuth del usuario bot" y configúralo en la integración de Slack.

e74c7e003c31258.png

Establece los campos obligatorios y haz clic en "Iniciar".

El valor de "Token de acceso" del agente es "Token de OAuth de usuario bot" de Slack.

El valor de "Signing Token" del agente es "Signing Secret" de Slack.

a00d22bdaeed3ab8.png

7e71e37750fd063a.png

Copia "URL de webhook" y vuelve a la configuración de la app de Slack.

Abre la sección "Event Subscriptions" y pega la URL.

a1e7271934c714d9.png

Guarda los cambios.

e6d9b43b3787b6e7.png

Abre "Slack" y agrega un agente escribiendo "@Agent".

Por ejemplo, agregar una app con el nombre "@CX".

72313066707f947b.png

63becbd80824f8d8.png

c98e193062b096f0.png

Pídele al agente un resumen del proyecto de JIRA.

6edfdb74760548ad.png

9. Preguntas y respuestas sobre documentos PDF

Crea un bucket de Cloud Storage

Abre GCS en la consola de Cloud: https://console.cloud.google.com/storage/browser

Crea un bucket nuevo.

Para el nombre del bucket, escribe "pdf-docs" + los últimos 5 dígitos de tu proyecto de GCP.

Tipo de ubicación: multi-region, us

Clase de almacenamiento: Standard

Control de acceso: Uniform

Protección de datos: uncheck soft delete policy

Haz clic en “Create”.

Confirma "Se impedirá el acceso público".

Descarga el informe en PDF y súbelo al bucket. https://services.google.com/fh/files/misc/exec_guide_gen_ai.pdf

Bucket con vista de archivo subido:

ff09ac8da88fb680.png

Configuración del almacén de datos

Regresa a la Consola del agente, abre "Agent", desplázate hacia abajo y haz clic en "+ Data store".

e20b69db922e37d7.png

Usa los siguientes valores:

Nombre de la herramienta: pdf-docs

Tipo: Data store

Descripción: pdf-docs

Haz clic en "Save".

c5bc7a2e458213ba.png

Haz clic en "Create a data store" en la parte inferior de la página.

Haz clic en “AGREE” cuando se te pregunte “¿Aceptas que tus almacenes de datos de búsqueda y conversaciones estén en la región de EE.UU.?”.

Escribe "Google" en el campo "Proporcionar empresa".

En la siguiente pantalla, haz clic en "CREATE DATA STORE".

Selecciona "Cloud Storage" como fuente de datos.

Prepara datos para la transferencia

https://cloud.google.com/generative-ai-app-builder/docs/prepare-data

Los archivos HTML y TXT deben tener un tamaño de 2.5 MB o menos.

Los archivos PDF, PPTX y DOCX deben tener un tamaño de 100 MB o menos.

Puedes importar hasta 100,000 archivos a la vez.

Selecciona: unstructured documents

Selecciona tu bucket o carpeta de GCS.

e8534a921059e3a2.png

Haz clic en Continuar: ed5ad1fabe9503a4.png

Para el nombre del almacén de datos, escribe: "pdf-docs"

Selecciona "Digital parser" en el menú desplegable.

Habilita la fragmentación avanzada.

Habilita los encabezados de principales en los fragmentos.

Haz clic en “Create”.

1a5222b86ee6c58e.png

3119b5fec43c9294.png

Selecciona el almacén de datos y haz clic en "Create".

43d5be0a0aca6f8.png

9fd7fc7c1462d114.png

Haz clic en el almacén de datos y revisa Documentos, Actividad y Configuración de procesamiento.

872d9142615e90c9.png

La importación tardará entre 5 y 10 minutos en completarse.

d9739a4af2244e03.png

Opciones de análisis y división

Puedes controlar el análisis de contenido de las siguientes maneras:

  • Analizador digital. El analizador digital está activado de forma predeterminada para todos los tipos de archivos, a menos que se especifique un tipo de analizador diferente. El analizador digital procesa los documentos transferidos si no se especifica otro analizador predeterminado para el almacén de datos o si el analizador especificado no admite el tipo de archivo de un documento transferido.
  • Análisis de OCR para archivos PDF Versión preliminar pública. Si planeas subir archivos PDF escaneados o con texto dentro de imágenes, puedes activar el analizador de OCR para mejorar el indexado de PDF. Consulta Acerca del análisis de OCR para archivos PDF.
  • Analizador de diseño. Versión preliminar pública. Activa el analizador de diseño para archivos HTML, PDF o DOCX si planeas usar Vertex AI Search para RAG. Consulta Chunk documents for RAG para obtener información sobre este analizador y cómo activarlo.

Obtén más información sobre el análisis y la fragmentación de documentos.

Configuración de herramientas

Regresa a la pestaña con la configuración de Herramientas.

Actualiza el navegador y selecciona "pdf-docs" en el menú desplegable Sin estructura.

71323e788b35ca66.png

Configura la conexión a tierra.

Escribe "Google" para el nombre de la empresa.

Configuración de la carga útil: Marca "Include snippets in the response payload".

b0cb701d13ad4264.png

Haz clic en “Save”.

91a546957bdfe029.png

7535b85cfc7febe6.png

Configuración de las instrucciones del agente

Regresa a la configuración del agente.

Agrega una instrucción nueva:

- Provide detailed answer to users questions about the exec guide to gen ai using information in the ${TOOL:pdf-docs}

9b9548497ddaccbd.png

Guarda la configuración.

Crea un ejemplo para la herramienta PDF-Docs

Cambia a la pestaña Ejemplos. Crea un ejemplo nuevo.

Con las acciones "+":

4da93695907c97ad.png

Agrega "Entrada del usuario":

What are the main capabilities?

Agrega "Uso de herramientas".

  • Herramienta y acción: "pdf-docs"

Entrada (requestBody)

{
  "query": "Main capabilities",
  "filter": "",
  "userMetadata": {},
  "fallback": ""
}

Resultado de la herramienta:

{
  "answer": "Detailed answer about main capabilities",
  "snippets": [
    {
      "uri": "https://storage.cloud.google.com/pdf-docs-49ca4/exec_guide_gen_ai.pdf",
      "text": "Detailed answer about main capabilities",
      "title": "exec_guide_gen_ai"
    }
  ]
}

Se agregó "Respuesta del agente"

Detailed answer about main capabilities. 

https://storage.cloud.google.com/pdf-docs-49ca4/exec_guide_gen_ai.pdf

Ejemplo configurado:

2968363e05f3325e.png

Configuración de invocación de herramientas:

658316bb29ac352d.png

Para probar la configuración, envía una pregunta al agente en el emulador.

Pregunta:

What are the 10 steps in the exec guide?

5b2329c494ad0d17.png

Selecciona "Agent" y haz clic en "Save example".

e79c86aa04a9572f.png

Proporciona el nombre "user-question-flow" y guárdalo.

Dale formato a la respuesta del agente y, luego, incluye el vínculo al documento PDF desde la sección de resultados de la herramienta.

50f2bcee082ac38d.png

Guarda el ejemplo.

Regresa al emulador y haz clic en "Replay conversation". Verifica el formato de respuesta actualizado.

8db40e424f448a2d.png

Haz otra pregunta:

What are the main capabilities in the exec guide?

6f103fdac8ec4cda.png

Documento PDF de origen

5b3e6d2ceda99247.png

Pregunta:

What should I consider when evaluating projects?

ec7e0f5884772385.png

Documento PDF de origen

57a0d331aa91f04b.png

Pregunta:

What are the priority use cases in Retail and CPG in the exec guide?

7a18ba3ca0fe90c5.png

Documento PDF de origen

b4d07e6e7d9adc00.png

10. Agentes compilados previamente

Explora los agentes compilados previamente en el menú de la izquierda.

5720dc5343aede65.png

Selecciona uno de los agentes y, luego, instálalo. Explora la configuración, las instrucciones y las herramientas de Agent.

2a3db1129b5a1461.png

11. ¡Felicitaciones!

¡Felicitaciones! Completaste el lab.

Temas abordados:

  • Cómo implementar la aplicación de Cloud Run para integrarla con las APIs de Gemini
  • Cómo crear e implementar el agente de Vertex AI
  • Cómo agregar la integración de Slack para el agente
  • Cómo configurar el almacén de datos para preguntas y respuestas en documentos PDF

¿Qué sigue?

Limpia

Para evitar que se apliquen cargos a tu cuenta de Google Cloud por los recursos usados en este instructivo, borra el proyecto que contiene los recursos o conserva el proyecto y borra los recursos individuales.

Borra el proyecto

La manera más fácil de eliminar la facturación es borrar el proyecto que creaste para el instructivo.

©2024 Google LLC Todos los derechos reservados. Google y el logotipo de Google son marcas de Google LLC. El resto de los nombres de productos y empresas pueden ser marcas de las respectivas empresas a las que están asociados.