ใช้ AI เอกสารการจัดซื้อเพื่อแยกวิเคราะห์ใบแจ้งหนี้โดยใช้สมุดบันทึก AI Platform

1. ภาพรวม

c65b9ae04aa1853.png

AI สำหรับเอกสารการจัดซื้อคืออะไร

องค์กรต่างๆ เป็นผู้จัดการกระบวนการจัดซื้อจัดจ้างขนาดใหญ่ รวมถึงใบแจ้งหนี้ ใบเสร็จ และเอกสารอื่นๆ ที่เกี่ยวข้องหลายพันรายการในแต่ละปี ใช้เอกสารการจัดซื้อเพื่อประมวลผล "ข้อมูลมืด" อย่างชาญฉลาด เช่น PDF, รูปภาพ และแบบฟอร์มที่เขียนด้วยลายมือเพื่อลดค่าใช้จ่ายด้วยตนเองในวงจรการจัดซื้อ สร้างระบบอัตโนมัติในการบันทึกข้อมูลการจัดซื้อในวงกว้างโดยการเปลี่ยนเอกสารที่ไม่มีโครงสร้าง เช่น ใบแจ้งหนี้และใบเสร็จให้เป็นข้อมูลที่มีโครงสร้าง เพื่อเพิ่มประสิทธิภาพในการดำเนินการ ปรับปรุงประสบการณ์ของลูกค้า และให้ข้อมูลประกอบการตัดสินใจ

ใน Codelab นี้ เราจะอธิบายวิธีตั้งค่า Document AI Platform, ประมวลผลตัวอย่างใบแจ้งหนี้, แยกและแสดงภาพเอนทิตีใน AI Platform Notebook

สิ่งที่คุณจะได้เรียนรู้

  • วิธีเริ่มต้นใช้งาน Document AI Platform
  • แยกเอนทิตีสคีมาโดยใช้โซลูชัน Procurement DocAI
  • สร้างและปรับแต่งอินสแตนซ์ AI Platform Notebooks

สิ่งที่คุณต้องมี

  • โปรเจ็กต์ Google Cloud
  • เบราว์เซอร์ เช่น Chrome หรือ Firefox
  • ความรู้เกี่ยวกับ Python 3

แบบสำรวจ

คุณจะใช้บทแนะนำนี้อย่างไร

อ่านเท่านั้น อ่านและทำแบบฝึกหัด

คุณจะให้คะแนนประสบการณ์การใช้งาน Python อย่างไร

มือใหม่ ระดับกลาง ผู้ชำนาญ

คุณจะให้คะแนนความพึงพอใจในการใช้บริการ Google Cloud อย่างไร

มือใหม่ ระดับกลาง ผู้ชำนาญ

2. การตั้งค่าและข้อกำหนด

การตั้งค่าสภาพแวดล้อมตามเวลาที่สะดวก

  1. ลงชื่อเข้าใช้ Cloud Console และสร้างโปรเจ็กต์ใหม่หรือใช้โปรเจ็กต์ที่มีอยู่ซ้ำ (หากยังไม่มีบัญชี Gmail หรือ G Suite คุณต้องสร้างบัญชี)

จำรหัสโปรเจ็กต์ ซึ่งเป็นชื่อที่ไม่ซ้ำกันในโปรเจ็กต์ Google Cloud ทั้งหมด (ชื่อด้านบนมีผู้ใช้แล้ว และไม่สามารถใช้กับคุณได้ ขออภัย) คุณต้องระบุรหัสนี้ในภายหลังเป็น PROJECT_ID

  1. ถัดไป คุณต้องเปิดใช้การเรียกเก็บเงินใน Cloud Console เพื่อใช้ทรัพยากร Google Cloud

ตรวจสอบว่าคุณได้ทำตามวิธีการใน "การล้างข้อมูล" ส่วนนี้จะแนะนำวิธีปิดทรัพยากรเพื่อไม่ให้มีการเรียกเก็บเงินนอกเหนือจากบทแนะนำนี้ ผู้ใช้ใหม่ของ Google Cloud จะมีสิทธิ์เข้าร่วมโปรแกรมทดลองใช้ฟรี$300 USD

3. เปิดใช้ Cloud Document AI API

ก่อนที่จะเริ่มใช้ Document AI คุณต้องเปิดใช้ API เปิด Cloud Console ในเบราว์เซอร์

  1. คลิกเมนูนำทาง ☰ > API และ บริการ > คลัง API การค้นหา
  2. ค้นหา "Document AI API" แล้วคลิกเปิดใช้เพื่อใช้ API ในโปรเจ็กต์ Google Cloud

4. สร้างและทดสอบโปรเซสเซอร์

ก่อนอื่น คุณต้องสร้างอินสแตนซ์ของโปรแกรมแยกวิเคราะห์แบบฟอร์มเพื่อใช้ใน Document AI Platform สำหรับบทแนะนำนี้

  1. ในคอนโซล ให้ไปที่ภาพรวมของ Document AI Platform
  2. คลิกสร้างตัวประมวลผล แล้วเลือกโปรแกรมแยกวิเคราะห์ใบแจ้งหนี้โปรเซสเซอร์
  3. ระบุชื่อผู้ประมวลผลข้อมูลและเลือกภูมิภาคของคุณจากรายการ
  4. คลิกสร้างเพื่อสร้างโปรเซสเซอร์
  5. คัดลอกรหัสผู้ประมวลผลข้อมูล คุณต้องใช้สิ่งนี้ในรหัสในภายหลัง

(ไม่บังคับ) คุณทดสอบโปรเซสเซอร์ในคอนโซลได้โดยการอัปโหลดเอกสาร คลิกอัปโหลดเอกสารและเลือกแบบฟอร์มที่จะแยกวิเคราะห์ คุณจะดาวน์โหลดและใช้ตัวอย่างแบบฟอร์มได้หากไม่มีแบบฟอร์มให้ใช้

ใบแจ้งหนี้

เอาต์พุตควรมีลักษณะดังนี้ ใบแจ้งหนี้ที่แยกวิเคราะห์

5. สร้าง AI Platform Notebook

ไปที่ส่วน AI Platform Notebooks ของ Cloud Console แล้วคลิกอินสแตนซ์ใหม่ จากนั้นเลือกประเภทอินสแตนซ์ Python ล่าสุดดังนี้

a81c82876c6c16f9.png

ใช้ตัวเลือกเริ่มต้นแล้วคลิกสร้าง เมื่อสร้างอินสแตนซ์แล้ว ให้เลือก Open JupyterLab

6. รับโค้ดตัวอย่าง

นำเข้าโค้ดตัวอย่างจาก GitHub Repo ของ Document AI Notebooks โดยตรง ในสมุดบันทึก ให้ไปที่ Git > โคลนที่เก็บในเมนูด้านบนหรือคลิกไอคอน Git: Git

วาง URL ของที่เก็บต่อไปนี้

https://github.com/GoogleCloudPlatform/documentai-notebooks.git

เมื่อโคลนที่เก็บแล้ว ให้คลิกผ่านไดเรกทอรี documentai-notebooks/specialized/ และเปิดสมุดบันทึก specialized_form_parser.ipynb ค้นหาเซลล์ที่มีการประกาศรหัสโปรเจ็กต์ GCP และผู้ประมวลผลข้อมูล AI เอกสาร

Vars

วางรหัสโปรเจ็กต์ GCP และรหัสผู้ประมวลผลข้อมูลจากขั้นตอนที่ 4 บันทึกสมุดบันทึก

7. แยกและแสดงภาพเอนทิตี

ตอนนี้คุณสามารถแยกเอนทิตีสคีมาออกจากใบแจ้งหนี้และคะแนนความเชื่อมั่นที่เกี่ยวข้องได้แล้ว ออบเจ็กต์การตอบกลับ Document มีรายการเอนทิตี หากต้องการอ่านเพิ่มเติมเกี่ยวกับเอนทิตีสคีมา โปรดอ่านการเริ่มต้นอย่างรวดเร็วของโปรแกรมแยกวิเคราะห์ใบแจ้งหนี้

เรียกใช้ทุกเซลล์ในสมุดบันทึกแล้วเลื่อนลงไปที่เอาต์พุตแบบตาราง โค้ดจะทำซ้ำผ่านแต่ละเอนทิตีและสร้าง Pandas DataFrame พร้อมผลลัพธ์ โต๊ะ

เลื่อนลงไปด้านล่างที่คอมโพเนนต์การแสดงข้อมูลผ่านภาพ การตอบสนองของออบเจ็กต์เอกสารมีข้อมูลเลย์เอาต์เชิงพื้นที่สำหรับแต่ละหน้าในเอกสาร ด้านล่างนี้จะมีการใช้ข้อมูลการออกแบบบนช่องของฟอร์มแต่ละช่องเพื่อวาดกรอบล้อมรอบในรูปภาพ ข้อมูลนี้ใช้เพื่อการผสานรวม Document AI เข้ากับแอปพลิเคชันฟรอนท์เอนด์ได้

Polys

8. ขอแสดงความยินดี

ยินดีด้วย คุณใช้โซลูชัน AI สำหรับเอกสารการจัดหาเพื่อดึงข้อมูลจากใบแจ้งหนี้เรียบร้อยแล้ว เราขอแนะนำให้คุณทดลองใช้แบบฟอร์มประเภทอื่นๆ

ล้างข้อมูล

คุณอาจปิดสมุดบันทึกหรือลบโปรเจ็กต์ GCP เพื่อหลีกเลี่ยงการเรียกเก็บเงินให้กับบัญชี Google Cloud สำหรับทรัพยากรที่ใช้ในบทแนะนำนี้

กำลังปิดการทำงานอินสแตนซ์ AI Platform Notebooks

ทำตามวิธีการเหล่านี้เพื่อปิดอินสแตนซ์ AI Platform Notebooks

กำลังลบโปรเจ็กต์

วิธีที่ง่ายที่สุดในการยกเลิกการเรียกเก็บเงินคือการลบโปรเจ็กต์ที่คุณสร้างไว้สำหรับบทแนะนำ

วิธีลบโปรเจ็กต์

  1. ในคอนโซล GCP ให้ไปที่หน้าโปรเจ็กต์ หน้าโปรเจ็กต์
  2. ในรายการโปรเจ็กต์ ให้เลือกโปรเจ็กต์ที่ต้องการลบ แล้วคลิกลบ
  3. ในกล่องโต้ตอบ ให้พิมพ์รหัสโปรเจ็กต์ แล้วคลิกปิดเครื่องเพื่อลบโปรเจ็กต์

ดูข้อมูลเพิ่มเติม

ใบอนุญาต

ผลงานนี้ได้รับอนุญาตภายใต้ใบอนุญาตทั่วไปครีเอทีฟคอมมอนส์แบบระบุแหล่งที่มา 2.0