Verwenden Sie Procurement Document AI, um Rechnungen mithilfe von AI Platform Notebooks zu parsen

1. Übersicht

c65b9ae04aa1853.png

Was ist Document AI für das Beschaffungswesen?

Unternehmen verwalten große Beschaffungspipelines mit Tausenden von Rechnungen, Belegen und anderen zugehörigen Dokumenten pro Jahr. Mit Procurement DocAI können Sie Ihre „dunklen Daten“ wie PDFs, Bilder und handschriftliche Formulare intelligent verarbeiten, um den manuellen Aufwand im Beschaffungszyklus zu reduzieren. Automatisieren Sie die Erfassung von Beschaffungsdaten im großen Stil: Verwandeln Sie unstrukturierte Dokumente wie Rechnungen und Belege in strukturierte Daten, um die betriebliche Effizienz zu steigern, die Nutzerumgebung zu optimieren und fundierte Grundlagen für die Entscheidungsfindung zu legen.

In diesem Codelab erfahren Sie, wie Sie die Document AI-Plattform einrichten, eine Beispielrechnung verarbeiten und Entitäten in einem AI Platform-Notebook extrahieren und visualisieren.

Aufgaben in diesem Lab

  • Erste Schritte mit der Document AI-Plattform
  • Schematisierte Entitäten mit der Procurement DocAI-Lösung extrahieren
  • AI Platform Notebooks-Instanz erstellen und anpassen

Voraussetzungen

Umfrage

Wie möchten Sie diese Anleitung verwenden?

Nur durchlesen Durchlesen und die Übungen absolvieren

Wie würden Sie Ihre Erfahrung mit Python bewerten?

Anfänger Fortgeschrittene Erfahren

Wie würden Sie Ihre Erfahrungen mit der Nutzung von Google Cloud-Diensten bewerten?

Anfänger Mittelstufe Fortgeschritten

2. Einrichtung und Anforderungen

Einrichtung der Umgebung im eigenen Tempo

  1. Melden Sie sich in der Cloud Console an und erstellen Sie ein neues Projekt oder verwenden Sie ein vorhandenes. Wenn Sie noch kein Gmail- oder G Suite-Konto haben, müssen Sie eines erstellen.

Notieren Sie sich die Projekt-ID. Diese ist für alle Google Cloud-Projekte eindeutig. (Dein Name oben ist leider schon vergeben.) Sie müssen diese ID später als PROJECT_ID angeben.

  1. Als Nächstes müssen Sie die Abrechnung in der Cloud Console aktivieren, um Google Cloud-Ressourcen verwenden zu können.

Folgen Sie unbedingt der Anleitung im Abschnitt „Bereinigen“. Dort erfahren Sie, wie Sie Ressourcen herunterfahren, damit keine Kosten über diese Anleitung hinaus anfallen. Neuen Nutzern der Google Cloud Platform steht das kostenlose Testprogramm mit einem Guthaben von 300$ zur Verfügung.

3. Cloud Document AI API aktivieren

Bevor Sie mit Document AI arbeiten können, müssen Sie die API aktivieren. Öffnen Sie die Cloud Console in Ihrem Browser.

  1. Klicken Sie auf das Navigationsmenü ☰ > APIs & Dienste > Bibliothek. Search API
  2. Suchen Sie nach „Document AI API“ und klicken Sie auf Aktivieren, um die API in Ihrem Google Cloud-Projekt zu verwenden.

4. Prozessor erstellen und testen

Sie müssen zuerst eine Instanz des Formularparser-Prozessors erstellen, die Sie in der Document AI-Plattform für diese Anleitung verwenden können.

  1. Rufen Sie in der Console die Übersicht über die Document AI-Plattform auf.
  2. Klicken Sie auf Prozessor erstellen und wählen Sie Rechnungsparser aus.Prozessoren
  3. Geben Sie einen Prozessornamen an und wählen Sie Ihre Region aus der Liste aus.
  4. Klicken Sie auf Erstellen, um den Prozessor zu erstellen.
  5. Kopieren Sie Ihre Prozessor-ID. Sie müssen sie später in Ihrem Code verwenden.

Optional: Sie können Ihren Prozessor in der Console testen, indem Sie ein Dokument hochladen. Klicken Sie auf Dokument hochladen und wählen Sie ein Formular aus, das analysiert werden soll. Wenn Sie kein Formular haben, können Sie dieses Musterformular herunterladen und verwenden.

Rechnung

Die Ausgabe sollte so aussehen: Geparste Rechnung

5. AI Platform Notebook erstellen

Rufen Sie in der Cloud Console den Bereich AI Platform Notebooks auf und klicken Sie auf Neue Instanz. Wählen Sie dann den neuesten Python-Instanztyp aus:

a81c82876c6c16f9.png

Verwenden Sie die Standardoptionen und klicken Sie dann auf Erstellen. Wählen Sie nach dem Erstellen der Instanz JupyterLab öffnen aus.

6. Beispielcode abrufen

Importieren Sie den Beispielcode direkt aus dem GitHub-Repository von Document AI Notebooks. Gehen Sie in Ihrem Notebook entweder im oberen Menü zu Git > Repository klonen oder klicken Sie auf das Git-Symbol: Git.

Fügen Sie die folgende Repository-URL ein:

https://github.com/GoogleCloudPlatform/documentai-notebooks.git

Nachdem das Repository geklont wurde, klicken Sie sich durch das Verzeichnis documentai-notebooks/specialized/ und öffnen Sie das Notebook specialized_form_parser.ipynb. Suchen Sie die Zelle, in der die GCP-Projekt-ID und die ID des Document AI-Prozessors deklariert sind.

vars

Fügen Sie die GCP-Projekt-ID und die Prozessor-ID aus Schritt 4 ein. Speichern Sie das Notebook.

7. Entitäten extrahieren und visualisieren

Jetzt können Sie die schematisierten Entitäten aus den Rechnungen und die entsprechenden Konfidenzwerte extrahieren. Das Antwortobjekt Document enthält eine Liste von Entitäten. Weitere Informationen zu den schematisierten Entitäten finden Sie in der Kurzanleitung für den Rechnungsparser.

Führen Sie alle Zellen in Ihrem Notebook aus und scrollen Sie nach unten zur tabellarischen Ausgabe. Der vorherige Code durchläuft jede Entität und erstellt einen Pandas DataFrame mit den Ergebnissen. Tisch

Scrollen Sie nun nach unten zur Visualisierungskomponente. Die Antwort des Document-Objekts enthält Informationen zum räumlichen Layout für jede Seite im Dokument. Unten werden die Layoutinformationen für jedes Formularfeld verwendet, um Begrenzungsrahmen im Bild zu zeichnen. Diese Daten können für die Einbindung von Document AI in eine Frontend-Anwendung verwendet werden.

polys

8. Glückwunsch

Herzlichen Glückwunsch! Sie haben die KI-Lösung für Beschaffungsdokumente erfolgreich verwendet, um Daten aus einer Rechnung zu extrahieren. Wir empfehlen Ihnen, mit anderen Formulartypen zu experimentieren.

Bereinigen

Damit Ihrem Google Cloud-Konto die in dieser Anleitung verwendeten Ressourcen nicht in Rechnung gestellt werden, können Sie entweder Ihr Notebook ausschalten oder das GCP-Projekt löschen.

AI Platform Notebooks-Instanz herunterfahren

Folgen Sie dieser Anleitung, um eine AI Platform Notebooks-Instanz herunterzufahren.

Projekt löschen

Am einfachsten vermeiden Sie weitere Kosten durch Löschen des für die Anleitung erstellten Projekts.

So löschen Sie das Projekt:

  1. Rufen Sie in der GCP Console die Seite Projekte auf. Seite „Projekte“
  2. Wählen Sie in der Projektliste das Projekt aus, das Sie löschen möchten, und klicken Sie auf Löschen.
  3. Geben Sie im Dialogfeld die Projekt-ID ein und klicken Sie auf Beenden, um das Projekt zu löschen.

Weitere Informationen

Lizenz

Dieser Text ist mit einer Creative Commons Attribution 2.0 Generic License lizenziert.