ใช้ AI เอกสารการจัดซื้อเพื่อแยกวิเคราะห์ใบแจ้งหนี้โดยใช้สมุดบันทึก AI Platform

1. ภาพรวม

c65b9ae04aa1853.png

AI ของเอกสารการสั่งซื้อคืออะไร

องค์กรต่างๆ ต้องจัดการไปป์ไลน์การจัดซื้อขนาดใหญ่ ซึ่งรวมถึงใบแจ้งหนี้ ใบเสร็จ และเอกสารอื่นๆ ที่เกี่ยวข้องหลายพันรายการในแต่ละปี ใช้ Procurement DocAI เพื่อประมวลผล "ข้อมูลมืด" อย่างชาญฉลาด เช่น PDF, รูปภาพ และแบบฟอร์มที่เขียนด้วยมือ เพื่อลดค่าใช้จ่ายเพิ่มเติมที่ต้องดำเนินการด้วยตนเองในวงจรการจัดซื้อ บันทึกข้อมูลการจัดซื้อโดยอัตโนมัติในวงกว้างด้วยการเปลี่ยนเอกสารที่ไม่มีโครงสร้าง เช่น ใบแจ้งหนี้และใบเสร็จ เป็น Structured Data เพื่อเพิ่มประสิทธิภาพการดําเนินงาน ปรับปรุงประสบการณ์ของลูกค้า และใช้เป็นข้อมูลในการตัดสินใจ

ใน Codelab นี้ เราจะอธิบายวิธีตั้งค่าแพลตฟอร์ม Document AI, ประมวลผลใบแจ้งหนี้ตัวอย่าง, ดึงข้อมูลและแสดงเอนทิตีเป็นภาพใน AI Platform Notebook

สิ่งที่คุณจะได้เรียนรู้

  • วิธีเริ่มต้นใช้งาน Document AI Platform
  • ดึงข้อมูลเอนทิตีที่มีสคีมาโดยใช้โซลูชัน Procurement DocAI
  • สร้างและปรับแต่งอินสแตนซ์ AI Platform Notebooks

สิ่งที่ต้องมี

  • โปรเจ็กต์ Google Cloud
  • เบราว์เซอร์ เช่น Chrome หรือ Firefox
  • ความรู้เกี่ยวกับ Python 3

แบบสํารวจ

คุณจะใช้บทแนะนำนี้อย่างไร

อ่านอย่างเดียว อ่านและทำแบบฝึกหัดให้เสร็จ

คุณจะให้คะแนนประสบการณ์การใช้งาน Python เท่าไร

ผู้ฝึกหัด ระดับกลาง ผู้ชำนาญ

คุณจะให้คะแนนประสบการณ์การใช้งานบริการ Google Cloud เท่าใด

ผู้ฝึกหัด ระดับกลาง ผู้ชำนาญ

2. การตั้งค่าและข้อกําหนด

การตั้งค่าสภาพแวดล้อมด้วยตนเอง

  1. ลงชื่อเข้าใช้ Cloud Console แล้วสร้างโปรเจ็กต์ใหม่หรือใช้โปรเจ็กต์ที่มีอยู่ซ้ำ (หากยังไม่มีบัญชี Gmail หรือ G Suite คุณต้องสร้างบัญชี)

โปรดจดจำรหัสโปรเจ็กต์ ซึ่งเป็นชื่อที่ไม่ซ้ำกันสำหรับโปรเจ็กต์ Google Cloud ทั้งหมด (ขออภัย ชื่อของคุณข้างต้นมีผู้ใช้แล้ว) คุณต้องระบุรหัสนี้ในภายหลังเป็น PROJECT_ID

  1. ถัดไป คุณต้องเปิดใช้การเรียกเก็บเงินใน Cloud Console เพื่อใช้ทรัพยากร Google Cloud

โปรดทำตามวิธีการในส่วน "การล้างข้อมูล" ส่วนนี้จะแนะนำวิธีปิดทรัพยากรเพื่อไม่ให้เกิดการเรียกเก็บเงินหลังจากบทแนะนำนี้ ผู้ใช้ใหม่ของ Google Cloud มีสิทธิ์เข้าร่วมโปรแกรมช่วงทดลองใช้ฟรีมูลค่า$300 USD

3. เปิดใช้ Cloud Document AI API

คุณต้องเปิดใช้ API ก่อนจึงจะเริ่มใช้ Document AI ได้ เปิด Cloud Console ในเบราว์เซอร์

  1. คลิกเมนูการนำทาง ☰ > API และบริการ > คลัง Search API
  2. ค้นหา "Document AI API" แล้วคลิกเปิดใช้เพื่อใช้ API ในโปรเจ็กต์ Google Cloud

4. สร้างและทดสอบโปรแกรมประมวลผล

คุณต้องสร้างอินสแตนซ์ของตัวประมวลผลโปรแกรมแยกวิเคราะห์แบบฟอร์มก่อนเพื่อใช้ใน Document AI Platform สำหรับบทแนะนำนี้

  1. ในคอนโซล ให้ไปที่ภาพรวมแพลตฟอร์ม AI ของเอกสาร
  2. คลิกสร้างตัวประมวลผล แล้วเลือกโปรแกรมแยกวิเคราะห์ใบแจ้งหนี้โปรเซสเซอร์
  3. ระบุชื่อผู้ประมวลผลและเลือกภูมิภาคจากรายการ
  4. คลิกสร้างเพื่อสร้างโปรแกรมประมวลผล
  5. คัดลอกรหัสผู้ประมวลผล คุณต้องใช้ในโค้ดในภายหลัง

(ไม่บังคับ) คุณสามารถทดสอบเครื่องประมวลผลในคอนโซลได้โดยอัปโหลดเอกสาร คลิกอัปโหลดเอกสาร แล้วเลือกแบบฟอร์มที่จะแยกวิเคราะห์ คุณสามารถดาวน์โหลดและใช้แบบฟอร์มตัวอย่างนี้ได้หากไม่มีแบบฟอร์มที่ใช้

ใบแจ้งหนี้

เอาต์พุตควรมีลักษณะดังนี้ ใบแจ้งหนี้ที่แยกวิเคราะห์แล้ว

5. สร้าง AI Platform Notebook

ไปที่ส่วน AI Platform Notebooks ของ Cloud Console แล้วคลิกอินสแตนซ์ใหม่ จากนั้นเลือกประเภทอินสแตนซ์ Python เวอร์ชันล่าสุด ดังนี้

a81c82876c6c16f9.png

ใช้ตัวเลือกเริ่มต้น แล้วคลิกสร้าง เมื่อสร้างอินสแตนซ์แล้ว ให้เลือกเปิด JupyterLab

6. รับโค้ดตัวอย่าง

นําเข้าโค้ดตัวอย่างจาก Github Repo ของ Document AI Notebook โดยตรง ในโน้ตบุ๊ก ให้ไปที่ Git > โคลนที่เก็บข้อมูลในเมนูด้านบน หรือคลิกไอคอน Git: Git

วาง URL ของที่เก็บต่อไปนี้

https://github.com/GoogleCloudPlatform/documentai-notebooks.git

เมื่อโคลนที่เก็บเรียบร้อยแล้ว ให้คลิกผ่านไดเรกทอรี documentai-notebooks/specialized/ แล้วเปิดโน้ตบุ๊ก specialized_form_parser.ipynb ค้นหาเซลล์ที่มีการประกาศรหัสโปรเจ็กต์ GCP และรหัสโปรแกรมประมวลผล AI ของเอกสาร

vars

วางรหัสโปรเจ็กต์ GCP และรหัสผู้ประมวลผลจากขั้นตอนที่ 4 บันทึกสมุดบันทึก

7. ดึงข้อมูลและแสดงเอนทิตีเป็นภาพ

ตอนนี้คุณสามารถดึงข้อมูลเอนทิตีสคีมาจากใบแจ้งหนี้และคะแนนความเชื่อมั่นที่เกี่ยวข้องได้แล้ว ออบเจ็กต์คำตอบเอกสารจะมีรายการเอนทิตี หากต้องการอ่านเพิ่มเติมเกี่ยวกับเอนทิตีสคีมา ให้อ่านคู่มือเริ่มต้นใช้งานของโปรแกรมแยกวิเคราะห์ใบแจ้งหนี้

เรียกใช้ทุกเซลล์ในสมุดบันทึก แล้วเลื่อนลงไปที่เอาต์พุตตาราง โค้ดก่อนหน้าจะวนผ่านเอนทิตีแต่ละรายการและสร้าง Pandas DataFrame ด้วยผลลัพธ์ โต๊ะ

จากนั้นเลื่อนลงไปที่คอมโพเนนต์การแสดงภาพ การตอบกลับออบเจ็กต์เอกสารจะมีข้อมูลเลย์เอาต์เชิงพื้นที่ของแต่ละหน้าในเอกสาร ด้านล่างนี้ ข้อมูลเลย์เอาต์ในช่องแบบฟอร์มแต่ละช่องใช้วาดกล่องขอบเขตในรูปภาพ ข้อมูลนี้สามารถใช้เพื่อผสานรวม Document AI เข้ากับแอปพลิเคชันส่วนหน้า

polys

8. ขอแสดงความยินดี

ยินดีด้วย คุณใช้โซลูชัน AI สำหรับเอกสารการสั่งซื้อเพื่อดึงข้อมูลจากใบแจ้งหนี้เรียบร้อยแล้ว เราขอแนะนำให้คุณลองใช้แบบฟอร์มประเภทอื่นๆ

ล้างข้อมูล

โปรดปิดเครื่องโน้ตบุ๊คหรือลบโปรเจ็กต์ GCP เพื่อเลี่ยงไม่ให้เกิดการเรียกเก็บเงินกับบัญชี Google Cloud สำหรับทรัพยากรที่ใช้ในบทแนะนำนี้

การปิดอินสแตนซ์ AI Platform Notebooks

ทําตามวิธีการเหล่านี้เพื่อปิดอินสแตนซ์ AI Platform Notebooks

การลบโปรเจ็กต์

วิธีที่ง่ายที่สุดในการหยุดการเรียกเก็บเงินคือการลบโปรเจ็กต์ที่คุณสร้างสำหรับบทแนะนำ

วิธีลบโปรเจ็กต์

  1. ในคอนโซล GCP ให้ไปที่หน้าโปรเจ็กต์ หน้าโปรเจ็กต์
  2. ในรายการโปรเจ็กต์ ให้เลือกโปรเจ็กต์ที่ต้องการลบ แล้วคลิกลบ
  3. ในกล่องโต้ตอบ ให้พิมพ์รหัสโปรเจ็กต์ แล้วคลิกปิดเพื่อลบโปรเจ็กต์

ดูข้อมูลเพิ่มเติม

ใบอนุญาต

ผลงานนี้ได้รับอนุญาตภายใต้สัญญาอนุญาตครีเอทีฟคอมมอนส์สำหรับยอมรับสิทธิของผู้สร้าง (Creative Commons Attribution License) 2.0 ทั่วไป