1. 概要
調達 Document AI とは
企業は、年間数千件の請求書、領収書、その他の関連ドキュメントを含む大規模な調達パイプラインを管理しています。Procurement DocAI を使用して、PDF、画像、手書きフォームなどの「ダークデータ」をインテリジェントに処理し、調達ライフサイクルの手動のオーバーヘッドを削減します。請求書や領収書などの非構造化ドキュメントを構造化データに変換して運用効率を高め、カスタマー エクスペリエンスを向上させ、意思決定に情報を提供することで、調達データのキャプチャを大規模に自動化します。
この Codelab では、Document AI Platform を設定し、請求書のサンプルを処理し、AI Platform Notebook でエンティティを抽出して可視化する方法について説明します。
学習内容
- Document AI プラットフォームの使用を開始する方法
- Procurement DocAI ソリューションを使用してスキーマ化されたエンティティを抽出する
- AI Platform Notebooks インスタンスを作成してカスタマイズする
必要なもの
アンケート
このチュートリアルをどのように使用されますか?
Python のご利用経験はどの程度ありますか?
Google Cloud サービスの使用経験はどの程度ありますか?
2. 設定と要件
セルフペース型の環境設定
- Cloud Console にログインし、新しいプロジェクトを作成するか、既存のプロジェクトを再利用します(Gmail アカウントまたは G Suite アカウントをお持ちでない場合は、アカウントを作成する必要があります)。
プロジェクト ID を控えておきます。プロジェクト ID は、すべての Google Cloud プロジェクトで 1 つしかない名前です。(上記の名前はすでに使用されているため使用できません)。以降では、PROJECT_ID
の箇所にこの ID を使用してください。
- 次に、Google Cloud リソースを使用するために、Cloud コンソールで課金を有効にする必要があります。
「クリーンアップ」セクションにある指示に従ってください。ここには、このチュートリアルの終了後に課金が発生しないようにリソースをシャットダウンする方法が記載されています。Google Cloud の新規ユーザーは、300 米ドル分の無料トライアル プログラムをご利用いただけます。
3. Cloud Document AI API を有効にする
Document AI を使用する前に、API を有効にする必要があります。ブラウザで Cloud コンソールを開きます。
- ナビゲーション メニュー > [API とサービス] > [ライブラリ]
をクリックします。
- 「Document AI API」を検索し、[有効にする] をクリックして、Google Cloud プロジェクトで API を使用します。
4. プロセッサを作成してテストする
このチュートリアルでは最初に、Document AI Platform で使用する Form Parser プロセッサのインスタンスを作成する必要があります。
- コンソールで [Document AI Platform Overview] に移動します。
- [プロセッサを作成] をクリックして、[Invoice Parser] を選択します。
- プロセッサ名を指定し、リージョンの一覧から選択します。
- [作成] をクリックして、プロセッサを作成します。
- プロセッサ ID をコピーします。これは、後でコードを作成する際に使用します。
(省略可)ドキュメントをアップロードして、コンソールでプロセッサをテストしてみましょう。[ドキュメントをアップロード] をクリックして、解析するフォームを選択します。フォームがない場合は、こちらのサンプル フォームをダウンロードして使用できます。
出力は次のようになります。
5. AI Platform Notebook を作成する
Cloud コンソールの [AI Platform Notebooks] セクションに移動し、[新しいインスタンス] をクリックします。次に、最新の Python インスタンス タイプを選択します。
デフォルトのオプションを使用し、[作成] をクリックします。インスタンスが作成されたら、[JUPYTERLAB を開く] を選択します。
6. サンプルコードを取得する
Document AI Notebooks の GitHub リポジトリからサンプルコードを直接インポートします。ノートブックで、上部のメニューで [Git] > [Clone Repository] に移動するか、Git アイコン をクリックします。
次のリポジトリ URL を貼り付けます。
https://github.com/GoogleCloudPlatform/documentai-notebooks.git
リポジトリのクローンを作成したら、documentai-notebooks/specialized/ ディレクトリをクリックして specialized_form_parser.ipynb
ノートブックを開きます。GCP プロジェクト ID と Document AI プロセッサ ID が宣言されているセルを見つけます。
ステップ 4 の GCP プロジェクト ID とプロセッサ ID を貼り付けます。ノートブックを保存します。
7. エンティティを抽出して可視化する
これで、請求書からスキーマ化されたエンティティと、それに対応する信頼スコアを抽出できます。Document レスポンス オブジェクトには、エンティティのリストが含まれます。スキーマ化されたエンティティの詳細については、請求書パーサーのクイックスタートをご覧ください。
ノートブックのすべてのセルを実行し、表形式の出力まで下にスクロールします。前のコードでは、各エンティティを反復処理し、結果を含む Pandas DataFrame を作成します。
下にスクロールして可視化コンポーネントまで移動します。Document オブジェクトのレスポンスには、ドキュメント内の各ページの空間レイアウト情報が含まれます。以下では、各フォーム フィールドのレイアウト情報を使用して、画像に境界ボックスを描画します。このデータは、Document AI をフロントエンド アプリケーションに統合するために使用できます。
8. 完了
これで、調達ドキュメント AI ソリューションを使用して請求書からデータを抽出できました。他のフォーム タイプを試すことをおすすめします。
クリーンアップ
このチュートリアルで使用したリソースについて Google Cloud アカウントに課金されないようにするには、ノートブックをシャットダウンするか、GCP プロジェクトを削除します。
AI Platform Notebooks インスタンスのシャットダウン
AI Platform Notebooks インスタンスをシャットダウンする手順は次のとおりです。
プロジェクトの削除
課金を停止する最も簡単な方法は、チュートリアル用に作成したプロジェクトを削除することです。
プロジェクトを削除するには、次の操作を行います。
- GCP Console で [プロジェクト] ページに移動します。[プロジェクト] ページ
- プロジェクト リストで、削除するプロジェクトを選択し、[削除] をクリックします。
- ダイアログでプロジェクト ID を入力し、[シャットダウン] をクリックしてプロジェクトを削除します。