1. Panoramica
Che cos'è Document AI per l'approvvigionamento?
Le aziende gestiscono ogni anno grandi pipeline di approvvigionamento, tra cui migliaia di fatture, ricevute e altri documenti correlati. Utilizza Procurement DocAI per elaborare in modo intelligente i "dark data", come PDF, immagini e moduli scritti a mano, in modo da ridurre il sovraccarico manuale del ciclo di approvvigionamento. Automatizza l'acquisizione di dati di approvvigionamento su larga scala trasformando documenti non strutturati come fatture e scontrini in dati strutturati per migliorare l'efficienza operativa e l'esperienza del cliente, oltre che acquisire informazioni per il processo decisionale.
In questo codelab illustreremo come configurare la piattaforma Document AI, elaborare una fattura di esempio, estrarre e visualizzare le entità in un notebook AI Platform.
Cosa imparerai a fare
- Come iniziare a utilizzare la piattaforma Document AI
- Estrarre entità schematizzate utilizzando la soluzione Procurement DocAI
- Creare e personalizzare un'istanza di AI Platform Notebooks
Che cosa ti serve
Sondaggio
Come utilizzerai questo tutorial?
Come valuteresti la tua esperienza con Python?
Come valuteresti la tua esperienza con l'utilizzo dei servizi Google Cloud?
2. Configurazione e requisiti
Configurazione dell'ambiente a tuo ritmo
- Accedi alla console Cloud e crea un nuovo progetto o riutilizzane uno esistente. Se non hai ancora un account Gmail o G Suite, devi crearne uno.
Ricorda l'ID progetto, un nome univoco per tutti i progetti Google Cloud. (Il nome sopra indicato è già stato utilizzato e non è disponibile). Dovrai fornire questo ID in un secondo momento come PROJECT_ID
.
- Successivamente, devi abilitare la fatturazione in Cloud Console per utilizzare le risorse Google Cloud.
Assicurati di seguire le istruzioni riportate nella sezione "Pulizia". La sezione ti consiglia come arrestare le risorse per evitare addebiti dopo questo tutorial. I nuovi utenti di Google Cloud sono idonei al programma Prova senza costi di 300$.
3. Abilita l'API Cloud Document AI
Prima di poter iniziare a utilizzare Document AI, devi attivare l'API. Apri Cloud Console nel browser.
- Fai clic su Menu di navigazione ☰ > API e servizi > Libreria.
- Cerca "API Document AI", quindi fai clic su Attiva per utilizzare l'API nel tuo progetto Google Cloud.
4. Creare e testare un processore
Per questo tutorial, devi prima creare un'istanza del processore di analisi sintattica dei moduli da utilizzare nella piattaforma Document AI.
- Nella console, vai a Panoramica della piattaforma Document AI.
- Fai clic su Crea processore e seleziona Analizzatore sintattico delle fatture
- Specifica un nome del processore e seleziona la tua regione dall'elenco.
- Fai clic su Crea per creare il processore.
- Copia il tuo ID processore. Lo dovrai utilizzare nel tuo codice in un secondo momento.
(Facoltativo) Puoi testare il tuo elaboratore nella console caricando un documento. Fai clic su Carica documento e seleziona un modulo da analizzare. Se non ne hai uno a disposizione, puoi scaricare e utilizzare questo modulo di esempio.
L'output dovrebbe essere simile al seguente:
5. Creare un blocco note per AI Platform
Vai alla sezione Blocchi note della piattaforma AI della console Cloud e fai clic su Nuova istanza. Quindi, seleziona il tipo di istanza Python più recente:
Utilizza le opzioni predefinite e poi fai clic su Crea. Una volta creata l'istanza, seleziona Apri JupyterLab.
6. Ottieni il codice di esempio
Importa direttamente il codice di esempio dal repository GitHub di Document AI Notebooks. Nel notebook, vai a Git > Clona un repository nel menu in alto o fai clic sull'icona di Git:
Incolla il seguente URL del repository:
https://github.com/GoogleCloudPlatform/documentai-notebooks.git
Dopo aver clonato il repository, fai clic sulla directory documentai-notebooks/specialized/ e apri il blocco note specialized_form_parser.ipynb
. Individua la cella in cui sono dichiarati gli ID progetto Google Cloud e del processore Document AI.
Incolla l'ID progetto Google Cloud e l'ID processore del passaggio 4. Salva il blocco note.
7. Estrai e visualizza le entità
Ora puoi estrarre le entità schematizzate dalle fatture e i relativi punteggi di attendibilità corrispondenti. L'oggetto di risposta Document contiene un elenco di entità. Per scoprire di più sulle entità schematizzate, leggi la guida introduttiva di Invoice Parser.
Esegui tutte le celle del blocco note e scorri verso il basso fino all'output tabulare. Il codice precedente esegue l'iterazione di ogni entità e crea un DataFrame Pandas con i risultati.
Ora scorri verso il basso fino al componente di visualizzazione. La risposta dell'oggetto Document contiene informazioni sul layout spaziale di ogni pagina del documento. Di seguito, le informazioni sul layout di ciascun campo del modulo vengono utilizzate per disegnare le caselle delimitanti sull'immagine. Questi dati possono essere utilizzati per integrare Document AI in un'applicazione frontend.
8. Complimenti
Congratulazioni, hai utilizzato la soluzione Document AI per l'approvvigionamento per estrarre i dati da una fattura. Ti invitiamo a sperimentare con altri tipi di moduli.
Esegui la pulizia
Per evitare che al tuo account Google Cloud vengano addebitati costi relativi alle risorse utilizzate in questo tutorial, puoi arrestare il notebook o eliminare il progetto Google Cloud.
Arresto dell'istanza di AI Platform Notebooks
Segui queste istruzioni per arrestare un'istanza di AI Platform Notebooks.
Elimina il progetto
Il modo più semplice per eliminare la fatturazione è eliminare il progetto che hai creato per il tutorial.
Per eliminare il progetto:
- Nella console di Google Cloud, vai alla pagina Progetti. Pagina Progetti
- Nell'elenco dei progetti, seleziona il progetto che vuoi eliminare e fai clic su Elimina.
- Nella finestra di dialogo, digita l'ID progetto e fai clic su Chiudi per eliminare il progetto.