1. סקירה כללית
מה זה AI מסוג מסמכי רכש?
ארגונים מנהלים צינורות רכש גדולים כל שנה, כולל אלפי חשבוניות, קבלות ומסמכים קשורים אחרים. להשתמש ב-Dock AI כדי לעבד את הנתונים הכהים בצורה חכמה כמו קובצי PDF, תמונות וטפסים בכתב יד, כדי לצמצם את התקורה הידנית במחזור החיים של הרכש. הפיכת מסמכים לא מובנים, כמו חשבוניות וקבלות לנתונים מובְנים, כדי לבצע אוטומציה של תיעוד דיגיטלי של נתוני רכש, וכך לשפר את היעילות התפעולית, לשפר את חוויית הלקוח ולקבל החלטות מושכלות יותר.
בשיעור ה-Codelab הזה נסביר איך להגדיר את Document AI Platform, לעבד חשבונית לדוגמה, לחלץ ישויות ולהמחיש אותן ב-AI Platform Notebook.
מה תלמדו
- איך מתחילים לעבוד עם Document AI Platform
- חילוץ ישויות מוסכמות באמצעות פתרון DocAI שנרכש
- יצירה והתאמה אישית של מכונה של notebooks ב-AI Platform
מה צריך להכין
סקר
איך תשתמשו במדריך הזה?
איזה דירוג מגיע לדעתך לחוויה שלך עם Python?
איזה דירוג מגיע לדעתך לחוויית השימוש שלך בשירותי Google Cloud?
2. הגדרה ודרישות
הגדרת סביבה בקצב עצמאי
- נכנסים למסוף Cloud ויוצרים פרויקט חדש או עושים שימוש חוזר בפרויקט קיים. (אם עדיין אין לכם חשבון Gmail או G Suite, עליכם ליצור חשבון).
חשוב לזכור את מזהה הפרויקט – שם ייחודי בכל הפרויקטים ב-Google Cloud. (השם שלך כבר תפוס ולא יעבוד, לצערי!). חובה לספק את המזהה הזה בהמשך בתור PROJECT_ID
.
- בשלב הבא צריך להפעיל את החיוב במסוף Cloud כדי להשתמש במשאבים של Google Cloud.
חשוב לבצע את כל ההוראות בקטע 'ניקוי' . הקטע מסביר איך להשבית את המשאבים כדי שלא תצברו חיובים מעבר למדריך הזה. משתמשים חדשים ב-Google Cloud זכאים להשתתף בתוכנית תקופת ניסיון בחינם בשווי 1,200 ש"ח.
3. הפעלת Cloud Document AI API
לפני שמתחילים להשתמש ב-Document AI, צריך להפעיל את ה-API. פותחים את מסוף Cloud בדפדפן.
- לוחצים על תפריט הניווט myactivity > ממשקי API שירותים > ספרייה.
- מחפשים את Document AI API, לוחצים על Enable כדי להשתמש ב-API בפרויקט ב-Google Cloud.
4. יצירה ובדיקה של מעבד
קודם כל צריך ליצור מכונה של מעבד טפסים לניתוח טפסים כדי להשתמש ב-Document AI Platform עבור המדריך הזה.
- במסוף, עוברים אל Document AI Platform Overview
- לוחצים על יצירת מעבד מידע ובוחרים באפשרות מנתח חשבוניות.
- מציינים שם מעבד ובוחרים את האזור שלכם מהרשימה.
- לוחצים על יצירה כדי ליצור את המעבד.
- מעתיקים את מזהה המעבד. חובה להשתמש בה בקוד מאוחר יותר.
(אופציונלי) אפשר לבדוק את המעבד במסוף על ידי העלאת מסמך. לוחצים על העלאת מסמך ובוחרים טופס לניתוח. אם אין לך טופס זמין לשימוש, אפשר להוריד את הטופס לדוגמה ולהשתמש בו.
הפלט אמור להיראות כך:
5. יצירת notebook של AI Platform
עוברים אל הקטע 'notebooks של AI Platform' במסוף Cloud ולוחצים על New Instance. לאחר מכן, בוחרים את סוג המכונה העדכני ביותר של Python:
משתמשים באפשרויות ברירת המחדל ואז לוחצים על יצירה. אחרי שהמכונה נוצרה, בוחרים באפשרות Open JupyterLab.
6. לקבלת הקוד לדוגמה
ייבוא ישיר של הקוד לדוגמה מ-GitHub Repo של Document AI Notebooks. ב-notebook, מנווטים אל Git > שכפול מאגר בתפריט העליון או לוחצים על סמל Git:
מדביקים את כתובת ה-URL של המאגר הבא:
https://github.com/GoogleCloudPlatform/documentai-notebooks.git
לאחר השכפול של המאגר, לוחצים על הספרייה documentai-notebooks/specialized/ ופותחים את ה-notebook שנקרא specialized_form_parser.ipynb
. מאתרים את התא שבו מוצהר על המזהים של מעבד GCP ושל Document AI.
מדביקים את מזהה הפרויקט ב-GCP ואת מזהה המעבד משלב 4. שומרים את ה-notebook.
7. חילוץ והצגה של הישויות
עכשיו אפשר לחלץ את הישויות שמותאמות לסכימה מהחשבוניות ומציוני הסמך המתאימים שלהן. אובייקט התשובה Document מכיל רשימת ישויות. למידע נוסף על ישויות בסכימה, קראו את המדריך למתחילים של מנתח החשבוניות.
מריצים את כל התאים ב-notebook וגוללים למטה עד שמגיעים לפלט בטבלה. הקוד מראש מבצע איטרציה דרך כל ישות ויוצר Pandas DataFrame עם התוצאות.
עכשיו גוללים למטה אל רכיב התצוגה החזותית. התשובה של אובייקט המסמך מכילה מידע על פריסה מרחבית של כל דף במסמך. פרטי הפריסה בכל שדה בטופס משמשים לשרטוט תיבות תוחמות על התמונה בתמונה. הנתונים האלה יכולים לשמש לשילוב של Document AI באפליקציה בקצה קדמי.
8. מזל טוב
מזל טוב, השתמשת בהצלחה בפתרון AI של מסמכי רכש כדי לחלץ נתונים מחשבונית. מומלץ לנסות סוגים אחרים של טפסים.
הסרת המשאבים
כדי להימנע מצבירת חיובים בחשבון Google Cloud על המשאבים שבהם השתמשתם במדריך הזה, אתם יכולים לכבות את ה-notebook או למחוק את הפרויקט ב-GCP.
בתהליך השבתה של מכונה של notebooks ב-AI Platform
פועלים לפי ההוראות האלה להשבתה של מופע של AI Platform Notebooks.
מחיקת הפרויקט
הדרך הקלה ביותר לבטל את החיוב היא למחוק את הפרויקט שיצרתם בשביל המדריך הזה.
כדי למחוק את הפרויקט:
- נכנסים לדף Projects במסוף GCP. דף הפרויקטים
- ברשימת הפרויקטים, בוחרים את הפרויקט שרוצים למחוק ולוחצים על מחיקה.
- כדי למחוק את הפרויקט, כותבים את מזהה הפרויקט בתיבת הדו-שיח ולוחצים על Shut down.