איך משתמשים ב-AI של מסמכי רכש כדי לנתח את החשבוניות באמצעות notebooks של AI Platform

1. סקירה כללית

c65b9ae04aa1853.png

מה זה AI מסוג מסמכי רכש?

ארגונים מנהלים צינורות רכש גדולים כל שנה, כולל אלפי חשבוניות, קבלות ומסמכים קשורים אחרים. להשתמש ב-Dock AI כדי לעבד את הנתונים הכהים בצורה חכמה כמו קובצי PDF, תמונות וטפסים בכתב יד, כדי לצמצם את התקורה הידנית במחזור החיים של הרכש. הפיכת מסמכים לא מובנים, כמו חשבוניות וקבלות לנתונים מובְנים, כדי לבצע אוטומציה של תיעוד דיגיטלי של נתוני רכש, וכך לשפר את היעילות התפעולית, לשפר את חוויית הלקוח ולקבל החלטות מושכלות יותר.

בשיעור ה-Codelab הזה נסביר איך להגדיר את Document AI Platform, לעבד חשבונית לדוגמה, לחלץ ישויות ולהמחיש אותן ב-AI Platform Notebook.

מה תלמדו

  • איך מתחילים לעבוד עם Document AI Platform
  • חילוץ ישויות מוסכמות באמצעות פתרון DocAI שנרכש
  • יצירה והתאמה אישית של מכונה של notebooks ב-AI Platform

מה צריך להכין

  • פרויקט ב-Google Cloud
  • דפדפן, כמו Chrome או Firefox
  • ידע ב-Python 3

סקר

איך תשתמשו במדריך הזה?

לקריאה בלבד לקרוא אותו ולבצע את התרגילים

איזה דירוג מגיע לדעתך לחוויה שלך עם Python?

מתחילים בינונית בקיאים

איזה דירוג מגיע לדעתך לחוויית השימוש שלך בשירותי Google Cloud?

מתחילים בינונית בקיאים

2. הגדרה ודרישות

הגדרת סביבה בקצב עצמאי

  1. נכנסים למסוף Cloud ויוצרים פרויקט חדש או עושים שימוש חוזר בפרויקט קיים. (אם עדיין אין לכם חשבון Gmail או G Suite, עליכם ליצור חשבון).

חשוב לזכור את מזהה הפרויקט – שם ייחודי בכל הפרויקטים ב-Google Cloud. (השם שלך כבר תפוס ולא יעבוד, לצערי!). חובה לספק את המזהה הזה בהמשך בתור PROJECT_ID.

  1. בשלב הבא צריך להפעיל את החיוב במסוף Cloud כדי להשתמש במשאבים של Google Cloud.

חשוב לבצע את כל ההוראות בקטע 'ניקוי' . הקטע מסביר איך להשבית את המשאבים כדי שלא תצברו חיובים מעבר למדריך הזה. משתמשים חדשים ב-Google Cloud זכאים להשתתף בתוכנית תקופת ניסיון בחינם בשווי 1,200 ש"ח.

3. הפעלת Cloud Document AI API

לפני שמתחילים להשתמש ב-Document AI, צריך להפעיל את ה-API. פותחים את מסוף Cloud בדפדפן.

  1. לוחצים על תפריט הניווט myactivity > ממשקי API שירותים > ספרייה. ממשק API לחיפוש
  2. מחפשים את Document AI API, לוחצים על Enable כדי להשתמש ב-API בפרויקט ב-Google Cloud.

4. יצירה ובדיקה של מעבד

קודם כל צריך ליצור מכונה של מעבד טפסים לניתוח טפסים כדי להשתמש ב-Document AI Platform עבור המדריך הזה.

  1. במסוף, עוברים אל Document AI Platform Overview
  2. לוחצים על יצירת מעבד מידע ובוחרים באפשרות מנתח חשבוניות.מעבדים
  3. מציינים שם מעבד ובוחרים את האזור שלכם מהרשימה.
  4. לוחצים על יצירה כדי ליצור את המעבד.
  5. מעתיקים את מזהה המעבד. חובה להשתמש בה בקוד מאוחר יותר.

(אופציונלי) אפשר לבדוק את המעבד במסוף על ידי העלאת מסמך. לוחצים על העלאת מסמך ובוחרים טופס לניתוח. אם אין לך טופס זמין לשימוש, אפשר להוריד את הטופס לדוגמה ולהשתמש בו.

חשבונית

הפלט אמור להיראות כך: ניתוח החשבונית

5. יצירת notebook של AI Platform

עוברים אל הקטע 'notebooks של AI Platform' במסוף Cloud ולוחצים על New Instance. לאחר מכן, בוחרים את סוג המכונה העדכני ביותר של Python:

a81c82876c6c16f9.png

משתמשים באפשרויות ברירת המחדל ואז לוחצים על יצירה. אחרי שהמכונה נוצרה, בוחרים באפשרות Open JupyterLab.

6. לקבלת הקוד לדוגמה

ייבוא ישיר של הקוד לדוגמה מ-GitHub Repo של Document AI Notebooks. ב-notebook, מנווטים אל Git > שכפול מאגר בתפריט העליון או לוחצים על סמל Git: Git

מדביקים את כתובת ה-URL של המאגר הבא:

https://github.com/GoogleCloudPlatform/documentai-notebooks.git

לאחר השכפול של המאגר, לוחצים על הספרייה documentai-notebooks/specialized/ ופותחים את ה-notebook שנקרא specialized_form_parser.ipynb. מאתרים את התא שבו מוצהר על המזהים של מעבד GCP ושל Document AI.

וארס

מדביקים את מזהה הפרויקט ב-GCP ואת מזהה המעבד משלב 4. שומרים את ה-notebook.

7. חילוץ והצגה של הישויות

עכשיו אפשר לחלץ את הישויות שמותאמות לסכימה מהחשבוניות ומציוני הסמך המתאימים שלהן. אובייקט התשובה Document מכיל רשימת ישויות. למידע נוסף על ישויות בסכימה, קראו את המדריך למתחילים של מנתח החשבוניות.

מריצים את כל התאים ב-notebook וגוללים למטה עד שמגיעים לפלט בטבלה. הקוד מראש מבצע איטרציה דרך כל ישות ויוצר Pandas DataFrame עם התוצאות. טבלה

עכשיו גוללים למטה אל רכיב התצוגה החזותית. התשובה של אובייקט המסמך מכילה מידע על פריסה מרחבית של כל דף במסמך. פרטי הפריסה בכל שדה בטופס משמשים לשרטוט תיבות תוחמות על התמונה בתמונה. הנתונים האלה יכולים לשמש לשילוב של Document AI באפליקציה בקצה קדמי.

פוליגונים

8. מזל טוב

מזל טוב, השתמשת בהצלחה בפתרון AI של מסמכי רכש כדי לחלץ נתונים מחשבונית. מומלץ לנסות סוגים אחרים של טפסים.

הסרת המשאבים

כדי להימנע מצבירת חיובים בחשבון Google Cloud על המשאבים שבהם השתמשתם במדריך הזה, אתם יכולים לכבות את ה-notebook או למחוק את הפרויקט ב-GCP.

בתהליך השבתה של מכונה של notebooks ב-AI Platform

פועלים לפי ההוראות האלה להשבתה של מופע של AI Platform Notebooks.

מחיקת הפרויקט

הדרך הקלה ביותר לבטל את החיוב היא למחוק את הפרויקט שיצרתם בשביל המדריך הזה.

כדי למחוק את הפרויקט:

  1. נכנסים לדף Projects במסוף GCP. דף הפרויקטים
  2. ברשימת הפרויקטים, בוחרים את הפרויקט שרוצים למחוק ולוחצים על מחיקה.
  3. כדי למחוק את הפרויקט, כותבים את מזהה הפרויקט בתיבת הדו-שיח ולוחצים על Shut down.

מידע נוסף

רישיון

היצירה הזו בשימוש ברישיון Creative Commons Attribution 2.0 גנרי.