1. Panoramica
Che cos'è Procurement Document AI?
Ogni anno le aziende gestiscono grandi pipeline di approvvigionamento, tra cui migliaia di fatture, ricevute e altri documenti correlati. Utilizza Procurement DocAI per elaborare in modo intelligente i tuoi "dati bui" come PDF, immagini e moduli scritti a mano per ridurre l'overhead manuale del ciclo di vita dell'approvvigionamento. Automatizza l'acquisizione di dati di approvvigionamento su larga scala trasformando documenti non strutturati come fatture e scontrini in dati strutturati per migliorare l'efficienza operativa e l'esperienza del cliente, oltre che acquisire informazioni per il processo decisionale.
In questo codelab, vedremo come configurare Document AI Platform, elaborare una fattura di esempio, estrarre e visualizzare le entità in un blocco note di AI Platform.
Cosa imparerai a fare
- Come iniziare a utilizzare Document AI Platform
- Estrai entità schematizzate utilizzando la soluzione Procurement DocAI
- Crea e personalizza un'istanza di AI Platform Notebooks
Che cosa ti serve
Sondaggio
Come utilizzerai questo tutorial?
Come valuteresti la tua esperienza con Python?
Come giudichi la tua esperienza di utilizzo dei servizi Google Cloud?
2. Configurazione e requisiti
Configurazione dell'ambiente da seguire in modo autonomo
- Accedi alla console Cloud e crea un nuovo progetto o riutilizzane uno esistente. Se non hai ancora un account Gmail o G Suite, devi crearne uno.
Ricorda l'ID progetto, un nome univoco tra tutti i progetti Google Cloud. Il nome indicato sopra è già in uso e non funzionerà per te. Devi fornire questo ID in un secondo momento come PROJECT_ID
.
- Successivamente, devi abilitare la fatturazione in Cloud Console per utilizzare le risorse Google Cloud.
Assicurati di seguire le istruzioni nella sezione "Pulizia" . Questa sezione spiega come arrestare le risorse in modo da non incorrere in fatturazione oltre questo tutorial. I nuovi utenti di Google Cloud sono idonei al programma prova senza costi di 300$.
3. Abilita l'API Cloud Document AI
Prima di poter iniziare a utilizzare Document AI, devi abilitare l'API. Apri la console Cloud nel browser.
- Fai clic sul menu di navigazione PUBLISHER > API e Servizi > Raccolta.
- Cerca "API Document AI" e fai clic su Abilita per utilizzare l'API nel tuo progetto Google Cloud.
4. crea e testa un processore
Devi prima creare un'istanza del processore dell'analizzatore sintattico di moduli da utilizzare in Document AI Platform per questo tutorial.
- Nella console, vai a Document AI Platform Overview
- Fai clic su Crea processore e seleziona Analizzatore fatture
- Specifica un nome del processore e seleziona la tua regione dall'elenco.
- Fai clic su Crea per creare il tuo processore
- Copia il tuo ID processore. Lo dovrai utilizzare nel tuo codice in un secondo momento.
(Facoltativo) Puoi testare il tuo processore nella console caricando un documento. Fai clic su Carica documento e seleziona un modulo da analizzare. Puoi scaricare e utilizzare questo modulo di esempio se non ne hai uno disponibile.
L'output dovrebbe avere il seguente aspetto:
5. Creare un blocco note per AI Platform
Vai alla sezione AI Platform Notebooks della console Cloud e fai clic su Nuova istanza. Quindi seleziona il tipo di istanza Python più recente:
Utilizza le opzioni predefinite e fai clic su Crea. Una volta creata l'istanza, seleziona Apri JupyterLab.
6. Ottieni il codice campione
Importa direttamente il codice campione dal repository GitHub di Document AI Notebooks. Nel blocco note, vai a Git > Clona un repository nel menu in alto o fai clic sull'icona Git:
Incolla il seguente URL del repository:
https://github.com/GoogleCloudPlatform/documentai-notebooks.git
Una volta clonato il repository, fai clic nella directory documentai-notebooks/specialized/ e apri il blocco note specialized_form_parser.ipynb
. Trova la cella in cui sono dichiarati gli ID processore del progetto Google Cloud e Document AI.
Incolla l'ID progetto e l'ID processore Google Cloud del passaggio 4. Salva il blocco note.
7. Estrazione e visualizzazione delle entità
Ora puoi estrarre le entità schematizzate dalle fatture e i relativi punteggi di confidenza. L'oggetto di risposta Document contiene un elenco di entità. Per saperne di più sulle entità schematizzate, consulta la guida rapida dell'analizzatore sintattico delle fatture.
Esegui tutte le celle del blocco note e scorri verso il basso fino all'output tabulare. Il codice precedente esegue l'iterazione attraverso ogni entità e crea un DataFrame Pandas con i risultati.
Ora scorri in basso fino al componente di visualizzazione. La risposta dell'oggetto Document contiene informazioni sul layout spaziale per ogni pagina del documento. Di seguito, le informazioni sul layout di ogni campo del modulo vengono utilizzate per disegnare riquadri di delimitazione nell'immagine. Questi dati possono essere utilizzati per integrare Document AI in un'applicazione frontend.
8. Complimenti
Complimenti, hai utilizzato correttamente la soluzione Procurment Document AI per estrarre i dati da una fattura. Ti invitiamo a provare con altri tipi di moduli.
Esegui la pulizia
Per evitare che al tuo account Google Cloud vengano addebitati costi relativi alle risorse utilizzate in questo tutorial, puoi arrestare il blocco note o eliminare il progetto Google Cloud.
Arresto dell'istanza di AI Platform Notebooks
Segui queste istruzioni per arrestare un'istanza di AI Platform Notebooks.
Elimina il progetto
Il modo più semplice per eliminare la fatturazione è quello di eliminare il progetto che hai creato per il tutorial.
Per eliminare il progetto:
- Nella console Google Cloud, vai alla pagina Progetti. Pagina Progetti
- Nell'elenco dei progetti, seleziona il progetto che vuoi eliminare e fai clic su Elimina.
- Nella finestra di dialogo, digita l'ID progetto, quindi fai clic su Chiudi per eliminare il progetto.