Sử dụng AI trong tài liệu mua sắm để phân tích cú pháp hoá đơn bằng Sổ tay trên nền tảng AI

1. Tổng quan

c65b9ae04aa1853.png

AI xử lý tài liệu mua sắm là gì?

Mỗi năm, các doanh nghiệp quản lý hàng nghìn hoá đơn, biên nhận và các tài liệu liên quan khác trong quy trình mua sắm lớn. Sử dụng Procurement DocAI để xử lý thông minh "dữ liệu tối" như tệp PDF, hình ảnh và biểu mẫu viết tay để giảm chi phí thủ công trong vòng đời của quy trình mua sắm. Tự động thu thập dữ liệu về hoạt động mua sắm trên quy mô lớn bằng cách chuyển các tài liệu không có cấu trúc như hoá đơn và biên nhận thành dữ liệu có cấu trúc để tăng hiệu quả hoạt động, cải thiện trải nghiệm khách hàng và hỗ trợ quá trình ra quyết định.

Trong lớp học lập trình này, chúng ta sẽ tìm hiểu cách thiết lập Nền tảng AI cho tài liệu, xử lý một hoá đơn mẫu, trích xuất và trực quan hoá các thực thể trong Sổ tay trên Nền tảng AI.

Kiến thức bạn sẽ học được

  • Cách bắt đầu sử dụng Nền tảng AI cho tài liệu
  • Trích xuất các thực thể được lập trình bằng Giải pháp Procurement DocAI
  • Tạo và tuỳ chỉnh một thực thể AI Platform Notebooks

Bạn cần có

  • Một dự án trên Google Cloud
  • Trình duyệt, chẳng hạn như Chrome hoặc Firefox
  • Có kiến thức về Python 3

Bài khảo sát

Bạn sẽ sử dụng hướng dẫn này như thế nào?

Chỉ đọc qua Đọc và hoàn thành bài tập

Bạn đánh giá thế nào về trải nghiệm của mình với Python?

Tân binh Trung cấp Thành thạo

Bạn đánh giá trải nghiệm sử dụng các dịch vụ của Google Cloud như thế nào?

Tân binh Trung cấp Thành thạo

2. Cách thiết lập và các yêu cầu

Thiết lập môi trường theo tốc độ của riêng bạn

  1. Đăng nhập vào Cloud Console rồi tạo một dự án mới hoặc sử dụng lại một dự án hiện có. (Nếu chưa có tài khoản Gmail hoặc G Suite, bạn phải tạo một tài khoản.)

Ghi nhớ mã dự án, một tên duy nhất trên tất cả các dự án Google Cloud. (Rất tiếc, tên của bạn ở trên đã được sử dụng và không dùng được nữa!). Bạn phải cung cấp mã nhận dạng này sau này dưới dạng PROJECT_ID.

  1. Tiếp theo, bạn phải bật tính năng thanh toán trong Cloud Console để sử dụng các tài nguyên của Google Cloud.

Hãy nhớ làm theo mọi hướng dẫn trong phần "Dọn dẹp". Phần này sẽ hướng dẫn bạn cách tắt các tài nguyên để không phải trả phí sau khi hoàn tất hướng dẫn này. Người dùng mới của Google Cloud đủ điều kiện tham gia chương trình Dùng thử miễn phí 300 USD.

3. Bật Cloud Document AI API

Trước khi có thể bắt đầu sử dụng Document AI, bạn phải bật API. Mở Cloud Console trong trình duyệt.

  1. Nhấp vào Trình đơn điều hướng ☰ > API và dịch vụ > Thư viện. Search API
  2. Tìm "Document AI API", sau đó nhấp vào Bật để sử dụng API trong dự án Google Cloud của bạn

4. Tạo và kiểm thử một bộ xử lý

Trước tiên, bạn phải tạo một thực thể của trình xử lý Trình phân tích cú pháp biểu mẫu để sử dụng trong Document AI Platform cho hướng dẫn này.

  1. Trong bảng điều khiển, hãy chuyển đến phần Tổng quan về nền tảng AI cho tài liệu
  2. Nhấp vào Tạo trình xử lý rồi chọn Trình phân tích cú pháp hoá đơnBộ xử lý
  3. Chỉ định tên bộ xử lý rồi chọn khu vực của bạn trong danh sách.
  4. Nhấp vào Tạo để tạo trình xử lý
  5. Sao chép mã nhận dạng bộ xử lý. Bạn phải sử dụng mã này trong mã của mình sau này.

(Không bắt buộc) Bạn có thể kiểm thử bộ xử lý trong bảng điều khiển bằng cách tải một tài liệu lên. Nhấp vào Tải tài liệu lên rồi chọn một biểu mẫu để phân tích cú pháp. Bạn có thể tải xuống và sử dụng biểu mẫu mẫu này nếu không có biểu mẫu nào để sử dụng.

Hóa đơn

Kết quả sẽ có dạng như sau: Hóa đơn đã phân tích cú pháp

5. Tạo sổ tay trên Nền tảng AI

Chuyển đến phần AI Platform Notebooks (Sổ tay AI Platform) của Cloud Console rồi nhấp vào New Instance (Thực thể mới). Sau đó, chọn loại thực thể Python mới nhất:

a81c82876c6c16f9.png

Sử dụng các tuỳ chọn mặc định rồi nhấp vào Tạo. Sau khi tạo thực thể, hãy chọn Open JupyterLab (Mở JupyterLab).

6. Tải mã mẫu

Nhập trực tiếp mã mẫu từ Kho lưu trữ GitHub của Sổ tay AI cho tài liệu. Trong sổ tay, hãy chuyển đến Git > Sao chép kho lưu trữ trong trình đơn trên cùng hoặc nhấp vào biểu tượng Git: Git

Dán URL kho lưu trữ sau đây:

https://github.com/GoogleCloudPlatform/documentai-notebooks.git

Sau khi sao chép kho lưu trữ, hãy nhấp vào thư mục documentai-notebooks/specialized/ rồi mở sổ tay specialized_form_parser.ipynb. Tìm ô khai báo Mã dự án GCP và Mã trình xử lý AI của tài liệu.

vars

Dán Mã dự án GCP và Mã bộ xử lý của bạn từ bước 4. Lưu sổ tay.

7. Trích xuất và trực quan hoá các thực thể

Giờ đây, bạn có thể trích xuất các thực thể được lập sơ đồ từ hoá đơn và điểm tin cậy tương ứng của các thực thể đó. Đối tượng phản hồi Tài liệu chứa danh sách các thực thể. Để đọc thêm về các thực thể được lập trình, hãy đọc bài viết bắt đầu nhanh về Trình phân tích cú pháp hoá đơn.

Chạy tất cả các ô trong sổ tay rồi di chuyển xuống kết quả dạng bảng. Mã trước đó lặp lại qua từng thực thể và tạo một Pandas DataFrame với kết quả. bàn

Bây giờ, hãy di chuyển xuống thành phần hình ảnh. Phản hồi đối tượng Tài liệu chứa thông tin bố cục không gian cho mỗi trang trong tài liệu. Dưới đây, thông tin bố cục trên mỗi trường biểu mẫu được dùng để vẽ hộp giới hạn trên hình ảnh. Bạn có thể dùng dữ liệu này để tích hợp Document AI vào một ứng dụng giao diện người dùng.

polys

8. Xin chúc mừng

Chúc mừng bạn đã sử dụng thành công Giải pháp AI cho tài liệu mua sắm để trích xuất dữ liệu từ một hoá đơn. Bạn nên thử nghiệm các loại biểu mẫu khác.

Dọn dẹp

Để tránh bị tính phí cho tài khoản Google Cloud của mình đối với các tài nguyên được sử dụng trong hướng dẫn này, bạn có thể tắt máy tính xách tay hoặc xoá Dự án GCP.

Tắt thực thể Sổ tay trên AI Platform

Hãy làm theo các hướng dẫn này để tắt một thực thể Máy tính xách tay trên Nền tảng AI.

Xoá dự án

Cách dễ nhất để loại bỏ tính năng thanh toán là xoá dự án mà bạn đã tạo cho hướng dẫn này.

Cách xoá dự án:

  1. Trong Bảng điều khiển GCP, hãy chuyển đến trang Projects (Dự án). Trang dự án
  2. Trong danh sách dự án, hãy chọn dự án bạn muốn xoá rồi nhấp vào Xoá.
  3. Trong hộp thoại, hãy nhập mã dự án, sau đó nhấp vào Shut down (Tắt) để xoá dự án.

Tìm hiểu thêm

Giấy phép

Tác phẩm này được cấp phép theo Giấy phép chung Ghi công theo Creative Commons 2.0.