AI Platform Notebooks की मदद से अपने इनवॉइस पार्स करने के लिए, प्रोक्योरमेंट डॉक्यूमेंट एआई (AI) का इस्तेमाल करें

1. खास जानकारी

c65b9ae04aa1853.png

खरीदारी से जुड़े दस्तावेज़ों के लिए एआई क्या है?

एंटरप्राइज़ हर साल, खरीदारी से जुड़ी बड़ी पाइपलाइन मैनेज करते हैं. इनमें हज़ारों इनवॉइस, रसीदें, और इससे जुड़े अन्य दस्तावेज़ शामिल होते हैं. Procurement DocAI का इस्तेमाल करके, अपने "डार्क डेटा" को बेहतर तरीके से प्रोसेस करें. जैसे, PDF, इमेज, और हाथ से लिखे गए फ़ॉर्म. इससे, खरीदारी के लाइफ़साइकल में मैन्युअल तरीके से होने वाले खर्च को कम किया जा सकता है. इनवॉइस और रसीद जैसे अनस्ट्रक्चर्ड दस्तावेज़ों को स्ट्रक्चर्ड डेटा में बदलकर, बड़े पैमाने पर परचेज़मेंट डेटा कैप्चर करने की प्रोसेस को ऑटोमेट करें. इससे ऑपरेशनल परफ़ॉर्मेंस बेहतर होगी, ग्राहक अनुभव बेहतर होगा, और फ़ैसले लेने में मदद मिलेगी.

इस कोडलैब में, हम Document AI Platform को सेट अप करने, सैंपल इनवॉइस को प्रोसेस करने, और एआई प्लैटफ़ॉर्म नोटबुक में इकाइयों को निकालने और विज़ुअलाइज़ करने का तरीका जानेंगे.

आपको इनके बारे में जानकारी मिलेगी

  • Document AI Platform का इस्तेमाल शुरू करने का तरीका
  • Procurement DocAI Solution का इस्तेमाल करके, स्कीमा वाली इकाइयों को निकालना
  • AI Platform Notebooks का इंस्टेंस बनाना और उसे पसंद के मुताबिक बनाना

आपको इन चीज़ों की ज़रूरत होगी

  • Google Cloud प्रोजेक्ट
  • कोई ब्राउज़र, जैसे कि Chrome या Firefox
  • Python 3 के बारे में जानकारी

सर्वे

इस ट्यूटोरियल का इस्तेमाल कैसे किया जाएगा?

सिर्फ़ इसे पढ़ें इसे पढ़ें और इसमें दिए गए अभ्यास पूरे करें

Python के साथ अपने अनुभव को लेकर, 1 से 5 के स्केल पर आप किस हद तक संतुष्ट हैं?

शुरुआती मध्यम बेहतर

Google Cloud की सेवाओं को इस्तेमाल करने के अपने अनुभव को क्या रेटिंग देंगे?

नौसिखिया मध्यम प्रवीण

2. सेटअप और ज़रूरी शर्तें

अपने हिसाब से एनवायरमेंट सेट अप करना

  1. Cloud Console में साइन इन करें और नया प्रोजेक्ट बनाएं या किसी मौजूदा प्रोजेक्ट का फिर से इस्तेमाल करें. (अगर आपके पास पहले से कोई Gmail या G Suite खाता नहीं है, तो आपको एक खाता बनाना होगा.)

प्रोजेक्ट आईडी याद रखें. यह Google Cloud के सभी प्रोजेक्ट में एक यूनीक नाम होता है. (माफ़ करें, ऊपर दिया गया नाम पहले से ही इस्तेमाल किया जा रहा है और यह आपके लिए काम नहीं करेगा!). आपको बाद में इस आईडी को PROJECT_ID के तौर पर देना होगा.

  1. इसके बाद, Google Cloud के संसाधनों का इस्तेमाल करने के लिए, आपको Cloud Console में बिलिंग की सुविधा चालू करनी होगी.

"साफ़-सफ़ाई" सेक्शन में दिए गए निर्देशों का पालन ज़रूर करें. इस सेक्शन में, संसाधनों को बंद करने का तरीका बताया गया है, ताकि इस ट्यूटोरियल के बाद आपसे कोई शुल्क न लिया जाए. Google Cloud के नए उपयोगकर्ता, 300 डॉलर के मुफ़्त ट्रायल वाले कार्यक्रम में शामिल हो सकते हैं.

3. Cloud Document AI API को चालू करना

Document AI का इस्तेमाल शुरू करने से पहले, आपको एपीआई चालू करना होगा. अपने ब्राउज़र में Cloud Console खोलें.

  1. नेविगेशन मेन्यू ☰ > एपीआई और सेवाएं > लाइब्रेरी पर क्लिक करें. Search API
  2. "Document AI API" खोजें. इसके बाद, अपने Google Cloud प्रोजेक्ट में एपीआई का इस्तेमाल करने के लिए, चालू करें पर क्लिक करें

4. प्रोसेसर बनाना और उसका टेस्ट करना

इस ट्यूटोरियल के लिए, आपको Document AI Platform में इस्तेमाल करने के लिए, फ़ॉर्म पार्स करने वाले प्रोसेसर का एक इंस्टेंस बनाना होगा.

  1. कंसोल में, Document AI प्लैटफ़ॉर्म की खास जानकारी पर जाएं
  2. प्रोसेसर बनाएं पर क्लिक करें और इनवॉइस पार्स करने वाला टूल चुनेंप्रोसेसर
  3. प्रोसेसर का नाम बताएं और सूची से अपना इलाका चुनें.
  4. प्रोसेसर बनाने के लिए, बनाएं पर क्लिक करें
  5. अपना प्रोसेसर आईडी कॉपी करें. आपको बाद में अपने कोड में इसका इस्तेमाल करना होगा.

(ज़रूरी नहीं) कंसोल में कोई दस्तावेज़ अपलोड करके, अपने प्रोसेसर की जांच की जा सकती है. दस्तावेज़ अपलोड करें पर क्लिक करें और पार्स करने के लिए कोई फ़ॉर्म चुनें. अगर आपके पास कोई फ़ॉर्म उपलब्ध नहीं है, तो इस सैंपल फ़ॉर्म को डाउनलोड करके इस्तेमाल किया जा सकता है.

बिल

आउटपुट इस तरह दिखना चाहिए: पार्स किया गया इनवॉइस

5. AI Platform Notebook बनाना

अपने Cloud Console के AI Platform Notebooks सेक्शन पर जाएं और नया इंस्टेंस पर क्लिक करें. इसके बाद, Python का सबसे नया इंस्टेंस टाइप चुनें:

a81c82876c6c16f9.png

डिफ़ॉल्ट विकल्पों का इस्तेमाल करें. इसके बाद, बनाएं पर क्लिक करें. इंस्टेंस बन जाने के बाद, JupyterLab खोलें को चुनें.

6. सैंपल कोड पाना

Document AI Notebooks के Github Repo से, सैंपल कोड को सीधे इंपोर्ट करें. अपनी नोटबुक में, सबसे ऊपर मौजूद मेन्यू में Git > रिपॉज़िटरी को क्लोन करें पर जाएं या Git आइकॉन पर क्लिक करें: Git

डेटा स्टोर करने की जगह का यह यूआरएल चिपकाएं:

https://github.com/GoogleCloudPlatform/documentai-notebooks.git

रिपॉज़िटरी का क्लोन बनाने के बाद, documentai-notebooks/specialized/ डायरेक्ट्री पर क्लिक करें और specialized_form_parser.ipynb नोटबुक खोलें. वह सेल ढूंढें जिसमें GCP प्रोजेक्ट और दस्तावेज़ के एआई प्रोसेसर आईडी बताए गए हैं.

vars

चौथे चरण में सेव किया गया अपना GCP प्रोजेक्ट आईडी और प्रोसेसर आईडी चिपकाएं. अपनी नोटबुक सेव करें.

7. इकाइयों को निकालना और विज़ुअलाइज़ करना

अब इनवॉइस से स्कीमा वाली इकाइयों और उनके कॉन्फ़िडेंस स्कोर को निकाला जा सकता है. दस्तावेज़ रिस्पॉन्स ऑब्जेक्ट में इकाइयों की सूची होती है. स्कीमा वाली इकाइयों के बारे में ज़्यादा जानने के लिए, इनवॉइस पार्स करने वाले टूल के बारे में शुरुआती जानकारी पढ़ें.

अपनी नोटबुक में सभी सेल चलाएं और टेबल के तौर पर दिखने वाले आउटपुट तक स्क्रोल करें. पहले कोड में, हर इकाई को दोहराया जाता है और नतीजों के साथ Pandas DataFrame बनाया जाता है. टेबल

अब स्क्रोल करके, विज़ुअलाइज़ेशन कॉम्पोनेंट पर जाएं. दस्तावेज़ ऑब्जेक्ट के जवाब में, दस्तावेज़ के हर पेज के लिए स्पेस के लेआउट की जानकारी होती है. यहां, हर फ़ॉर्म फ़ील्ड के लेआउट की जानकारी का इस्तेमाल, इमेज पर बाउंडिंग बॉक्स बनाने के लिए किया गया है. इस डेटा का इस्तेमाल, Document AI को फ़्रंटएंड ऐप्लिकेशन में इंटिग्रेट करने के लिए किया जा सकता है.

पॉली

8. बधाई हो

बधाई हो, आपने इनवॉइस से डेटा निकालने के लिए, परचेज़मेंट दस्तावेज़ के एआई सलूशन का इस्तेमाल किया है. हमारा सुझाव है कि आप दूसरे तरह के फ़ॉर्म आज़माकर देखें.

खाली करने के लिए जगह

इस ट्यूटोरियल में इस्तेमाल किए गए संसाधनों के लिए, आपके Google Cloud खाते से शुल्क न लिया जाए, इसके लिए अपनी नोटबुक बंद करें या GCP प्रोजेक्ट मिटाएं.

AI Platform Notebooks इंस्टेंस को बंद करना

AI Platform Notebooks इंस्टेंस को बंद करने के लिए, इन निर्देशों का पालन करें.

प्रोजेक्ट मिटाना

बिलिंग की सुविधा बंद करने का सबसे आसान तरीका, ट्यूटोरियल के लिए बनाया गया प्रोजेक्ट मिटाना है.

प्रोजेक्ट मिटाने के लिए:

  1. GCP Console में, प्रोजेक्ट पेज पर जाएं. प्रोजेक्ट पेज
  2. प्रोजेक्ट की सूची में, वह प्रोजेक्ट चुनें जिसे मिटाना है. इसके बाद, मिटाएं पर क्लिक करें.
  3. डायलॉग में, प्रोजेक्ट आईडी टाइप करें. इसके बाद, प्रोजेक्ट मिटाने के लिए बंद करें पर क्लिक करें.

ज़्यादा जानें

लाइसेंस

इस काम के लिए, Creative Commons Attribution 2.0 जनरल लाइसेंस के तहत लाइसेंस मिला है.