Use o Procurement Document AI para analisar suas faturas com o AI Platform Notebooks

1. Visão geral

c65b9ae04aa1853.png

O que é o Procurement Document AI?

As empresas gerenciam grandes pipelines de compras, incluindo milhares de faturas, recibos e outros documentos relacionados todos os anos. Use o Procurement DocAI para processar de forma inteligente seus "dark data" como PDFs, imagens e formulários manuscritos, para reduzir a sobrecarga manual do ciclo de vida de compras. Automatize a captura de dados de compras em escala transformando documentos, como faturas e recibos, em dados estruturados para aumentar a eficiência operacional, melhorar a experiência do cliente e tomar decisões fundamentadas em análises métricas.

Neste codelab, vamos mostrar como configurar a Document AI Platform, processar um exemplo de fatura, extrair e visualizar entidades em um notebook da AI Platform.

O que você vai aprender

  • Como começar a usar a Document AI Platform
  • Extrair entidades esquematizadas usando a solução Procurement DocAI
  • Criar e personalizar uma instância do AI Platform Notebooks

O que é necessário

  • Um projeto do Google Cloud
  • Um navegador, como o Chrome ou o Firefox
  • Conhecimento sobre o Python 3

Pesquisa

Como você vai usar este tutorial?

Apenas leitura Ler e fazer os exercícios

Como você classificaria sua experiência com Python?

Iniciante Intermediário Proficiente

Como você classificaria sua experiência de uso dos serviços do Google Cloud?

Iniciante Intermediário Proficiente

2. Configuração e requisitos

Configuração de ambiente autoguiada

  1. Faça login no Console do Cloud e crie um novo projeto ou reutilize um existente. Crie uma se você ainda não tiver uma conta do Gmail ou do G Suite.

Lembre-se do ID do projeto, um nome exclusivo em todos os projetos do Google Cloud. (seu nome acima já foi escolhido e não funcionará para você). Você precisará fornecer esse ID posteriormente como PROJECT_ID.

  1. Em seguida, é necessário ativar o faturamento no console do Cloud para usar os recursos do Google Cloud.

Siga todas as instruções da seção "Limpeza". Na seção, você aprende a encerrar recursos para não incorrer em cobranças além deste tutorial. Novos usuários do Google Cloud estão qualificados para o programa de US$ 300 de avaliação sem custos.

3. Ativar a API Document AI do Cloud

Antes de começar a usar a Document AI, você precisa ativar a API. Abra o Console do Cloud no navegador.

  1. Clique em Menu de navegação > APIs e serviços > Biblioteca. API Search
  2. Pesquise por "API Document AI" e clique em Ativar para usar a API no seu projeto do Google Cloud

4. Crie e teste um processador

Primeiro, você precisa criar uma instância do processador Form Parser para usar no Document AI Platform para este tutorial.

  1. No console, navegue até a Visão geral do Document AI Platform.
  2. Clique em Criar processador e selecione Analisador de faturasProcessadores
  3. Especifique um nome de processador e selecione sua região na lista.
  4. Clique em Criar para criar seu processador.
  5. Copie o ID do processador. Você precisará usá-la em seu código mais tarde.

(Opcional) É possível testar o processador no console fazendo upload de um documento. Clique em Fazer upload do documento e selecione um formulário para analisar. É possível fazer o download e usar este formulário de exemplo se você não tiver um disponível.

Fatura

A saída será parecida com esta: Fatura analisada

5. Crie um notebook do AI Platform

Acesse a seção de Notebooks do AI Platform do console do Cloud e clique em Nova instância. Em seguida, selecione o tipo de instância mais recente do Python:

a81c82876c6c16f9.png

Use as opções padrão e clique em Criar. Depois que a instância for criada, selecione Abrir JupyterLab.

6. Acesse o código de amostra

Importe diretamente o exemplo de código do repositório do GitHub dos Notebooks da Document AI. No notebook, acesse Git > Clone um Repository no menu superior ou clique no ícone do Git: Git

Cole o seguinte URL do repositório:

https://github.com/GoogleCloudPlatform/documentai-notebooks.git

Depois disso, clique no diretório documentai-notebooks/specialized/ e abra o notebook specialized_form_parser.ipynb. Encontre a célula em que os IDs do processador da Document AI e do projeto do GCP são declarados.

Vars

Cole o ID do projeto do GCP e o ID do processador da etapa 4. Salve seu notebook.

7. Extrair e visualizar as entidades

Agora é possível extrair as entidades esquematizadas das faturas e as pontuações de confiança correspondentes. O objeto de resposta Document contém uma lista de entidades. Para saber mais sobre as entidades esquematizadas, leia o guia de início rápido do Analisador de faturas.

Execute todas as células do seu notebook e role para baixo até a saída tabular. A priori do código itera em cada entidade e cria um DataFrame do Pandas com os resultados. tabela

Agora role a tela para baixo até o componente de visualização. A resposta do objeto Document contém informações de layout espacial para cada página no documento. Abaixo, as informações de layout em cada campo de formulário são usadas para desenhar caixas delimitadoras na imagem. Esses dados podem ser usados para integrar a Document AI em um aplicativo front-end.

polígonos

8. Parabéns

Parabéns, você usou a solução Procurment Document AI para extrair dados de uma fatura. Teste outros tipos de formulário.

Limpeza

Para evitar cobranças na sua conta do Google Cloud pelos recursos usados no tutorial, encerre o notebook ou exclua o projeto do GCP.

Como encerrar a instância do AI Platform Notebooks

Siga estas instruções para encerrar uma instância do AI Platform Notebooks.

Excluir o projeto

O jeito mais fácil de evitar cobranças é excluindo o projeto que você criou para este tutorial.

Para excluir o projeto:

  1. No Console do GCP, acesse a página Projetos. Página "Projetos"
  2. Na lista de projetos, selecione um e clique em Excluir.
  3. Na caixa de diálogo, digite o ID do projeto e clique em Encerrar para excluí-lo.

Saiba mais

Licença

Este conteúdo está sob a licença Atribuição 2.0 Genérica da Creative Commons.