Usa Procurement Document AI para analizar tus facturas con AI Platform Notebooks

1. Descripción general

c65b9ae04aa1853.png

¿Qué es Document AI para adquisiciones?

Las empresas administran grandes canales de adquisición, que incluyen miles de facturas, recibos y otros documentos relacionados cada año. Usa Adquisiciones DocAI para procesar de forma inteligente tus "datos oscuros", como archivos PDF, imágenes y formularios escritos a mano, y reducir la sobrecarga manual de tu ciclo de vida de adquisiciones. Convierte documentos no estructurados, como facturas y recibos, en datos estructurados para automatizar la captura de datos de adquisición a gran escala, aumentar la eficiencia operativa, mejorar la experiencia del cliente y fundamentar la toma de decisiones.

En este codelab, veremos cómo configurar Document AI Platform, procesar una factura de muestra, extraer y visualizar entidades en un notebook de AI Platform.

Qué aprenderás

  • Cómo comenzar a usar la plataforma de Document AI
  • Extrae entidades esquematizadas con la solución de Procurement DocAI
  • Crea y personaliza una instancia de AI Platform Notebooks

Requisitos

  • Un proyecto de Google Cloud
  • Un navegador, como Chrome o Firefox
  • Conocimiento de Python 3

Encuesta

¿Cómo usarás este instructivo?

Leer Leer y completar los ejercicios

¿Cómo calificarías tu experiencia en Python?

Principiante Intermedio Avanzado

¿Cómo calificarías tu experiencia en el uso de los servicios de Google Cloud?

Principiante Intermedio Avanzado

2. Configuración y requisitos

Configuración del entorno de autoaprendizaje

  1. Accede a la consola de Cloud y crea un proyecto nuevo o reutiliza uno existente. (Si todavía no tienes una cuenta de Gmail o de G Suite, debes crear una).

Recuerda el ID del proyecto, un nombre único en todos los proyectos de Google Cloud. (El nombre anterior ya está en uso y no lo podrás usar). Debes proporcionar este ID más adelante como PROJECT_ID.

  1. Luego, debes habilitar la facturación en la consola de Cloud para usar los recursos de Google Cloud.

Asegúrate de seguir las instrucciones de la sección “Realiza una limpieza”. En la sección, se aconseja cómo cerrar recursos para que no se te facture más allá de este instructivo. Los usuarios nuevos de Google Cloud son aptos para participar en el programa Prueba gratuita de $300.

3. Habilita la API de Cloud Document AI

Antes de comenzar a usar Document AI, debes habilitar la API. Abre la consola de Cloud en tu navegador.

  1. Haz clic en Menú de navegación ☰ > API y servicios > Biblioteca. API de Búsqueda
  2. Busca “API de Document AI” y, luego, haz clic en Habilitar para usar la API en su proyecto de Google Cloud.

4. Crea y prueba un procesador

Primero debes crear una instancia del procesador del analizador de formularios a fin de usarla en la plataforma de Document AI para este instructivo.

  1. En Console, navega a Descripción general de la plataforma de Document AI
  2. Haz clic en Crear procesador (Create Processor) y selecciona Analizador de facturas (Invoice Parser).Procesadores
  3. Especifica el nombre del procesador y selecciona tu región en la lista.
  4. Haz clic en Crear para crear tu procesador.
  5. Copia el ID del procesador. Debes usar esto en el código más adelante.

Para probar tu procesador en la consola, puedes subir un documento (opcional). Haz clic en Subir documento y selecciona un formulario para analizar. Puedes descargar y usar este formulario de muestra si no tienes uno disponible para usar.

Factura

El resultado debería verse así: Factura analizada

5. Cree un notebook en AI Platform

Navega a la sección AI Platform Notebooks de la consola de Cloud y haz clic en Instancia nueva. Luego, selecciona el tipo de instancia de Python más reciente:

a81c82876c6c16f9.png

Usa las opciones predeterminadas y, luego, haz clic en Crear. Una vez que se crea la instancia, selecciona Abrir JupyterLab.

6. Obtenga el código de muestra

Importa directamente el código de muestra desde el repositorio de GitHub de Notebooks de Document AI. En tu notebook, navega a Git > Clone a Repository en el menú de la parte superior o haz clic en el ícono de Git: Git

Pega la siguiente URL del repositorio:

https://github.com/GoogleCloudPlatform/documentai-notebooks.git

Una vez que se haya clonado el repositorio, haz clic en el directorio documentai-notebooks/specialized/ y abre el notebook specialized_form_parser.ipynb. Busca la celda en la que se declaran los IDs del proyecto de GCP y del procesador de Document AI.

vars

Pega el ID de proyecto y el ID del encargado del tratamiento de datos de GCP del paso 4. Guarda el notebook.

7. Extrae y visualiza las entidades

Ahora puedes extraer las entidades esquematizadas de las facturas y sus puntuaciones de confianza correspondientes. El objeto de respuesta Document contiene una lista de entidades. Para obtener más información sobre las entidades esquematizadas, lee la guía de inicio rápido de Invoice Parser.

Ejecuta todas las celdas del notebook y desplázate hacia abajo hasta el resultado tabular. El código anterior itera por cada entidad y crea un DataFrame de Pandas con los resultados. mesa

Ahora, desplázate hacia abajo hasta el componente de visualización. La respuesta del objeto Document contiene información de diseño espacial para cada página del documento. A continuación, la información de diseño de cada campo de formulario se usa para dibujar cuadros delimitados en la imagen. Estos datos se pueden usar para integrar Document AI en una aplicación de frontend.

polígonos

8. Felicitaciones

Felicitaciones, usaste correctamente la solución de Document AI de adquisición para extraer datos de una factura. Te recomendamos que experimentes con otros tipos de formularios.

Realiza una limpieza

Para evitar que se apliquen cargos a tu cuenta de Google Cloud por los recursos que usaste en este instructivo, puedes cerrar la notebook o borrar el proyecto de GCP.

Cómo cerrar la instancia de AI Platform Notebooks

Sigue estas instrucciones para cerrar una instancia de AI Platform Notebooks.

Borra el proyecto

La manera más fácil de eliminar la facturación es borrar el proyecto que creaste para el instructivo.

Para borrar el proyecto, haz lo siguiente:

  1. En GCP Console, ve a la página Proyectos. Página Proyectos
  2. En la lista de proyectos, selecciona el proyecto que deseas borrar y haz clic en Borrar.
  3. En el cuadro de diálogo, escribe el ID del proyecto y haz clic en Cerrar para borrarlo.

Más información

Licencia

Este trabajo cuenta con una licencia Atribución 2.0 Genérica de Creative Commons.