1. खास जानकारी
प्रोक्योरमेंट डॉक्यूमेंट एआई (AI) क्या है?
यह कंपनी बड़ी संख्या में सामान खरीदने की प्रोसेस मैनेज करती है. इसमें हर साल हज़ारों इनवॉइस, रसीद, और इसी तरह के दूसरे दस्तावेज़ शामिल होते हैं. अपने "डार्क डेटा" को बेहतर तरीके से प्रोसेस करने के लिए, Google की निजता नीति का इस्तेमाल करें जैसे, PDF, इमेज, और हाथ से लिखे गए फ़ॉर्म. इनवॉइस और रसीद जैसे बिना स्ट्रक्चर वाले दस्तावेज़ों को स्ट्रक्चर्ड डेटा में बदलकर, बड़े पैमाने पर प्रोक्योरमेंट डेटा को अपने-आप कैप्चर करने की सुविधा देता है. इससे काम की क्षमता बढ़ाने, खरीदारों के अनुभव को बेहतर बनाने, और सही फ़ैसले लेने में मदद मिलती है.
इस कोडलैब में, हम AI Platform Notebook में दस्तावेज़ के लिए AI Platform सेट अप करने, इनवॉइस के सैंपल को प्रोसेस करने, और इकाइयों को एक्सट्रैक्ट करने और विज़ुअलाइज़ करने का तरीका जानेंगे.
आपको इनके बारे में जानकारी मिलेगी
- Document AI Platform का इस्तेमाल शुरू करने का तरीका
- Procurement DocAI समाधान का इस्तेमाल करके स्कीमा वाली इकाइयां निकालें
- AI Platform Notebooks इंस्टेंस बनाना और उसे पसंद के मुताबिक बनाना
आपको इन चीज़ों की ज़रूरत होगी
सर्वे
इस ट्यूटोरियल का इस्तेमाल कैसे किया जाएगा?
Python के साथ अपने अनुभव को आप कितनी रेटिंग देंगे?
Google Cloud की सेवाएं इस्तेमाल करने का आपका अनुभव कैसा रहा?
2. सेटअप और ज़रूरी शर्तें
अपने हिसाब से एनवायरमेंट सेटअप करना
- Cloud Console में साइन इन करें और नया प्रोजेक्ट बनाएं या किसी मौजूदा प्रोजेक्ट का फिर से इस्तेमाल करें. (अगर आपके पास पहले से Gmail या G Suite खाता नहीं है, तो आपको एक खाता बनाना होगा.)
प्रोजेक्ट आईडी याद रखें. यह Google Cloud के सभी प्रोजेक्ट के लिए एक खास नाम होता है. (आपका ऊपर दिया गया नाम पहले ही लिया जा चुका है और आपके लिए यह काम नहीं करेगा, क्षमा करें!). आपको यह आईडी बाद में, PROJECT_ID
के तौर पर देना होगा.
- इसके बाद, आपको Google Cloud के संसाधनों का इस्तेमाल करने के लिए, Cloud Console में बिलिंग की सुविधा चालू करनी होगी.
"साफ़ करना" सेक्शन में दिए गए निर्देशों का पालन करना न भूलें सेक्शन में जाएं. इस सेक्शन में, संसाधनों को बंद करने का तरीका बताया गया है. इससे इस ट्यूटोरियल के अलावा बिलिंग की सुविधा नहीं मिलेगी. Google Cloud के नए उपयोगकर्ता, 300USD डॉलर के मुफ़्त में आज़माने वाले प्रोग्राम में हिस्सा ले सकते हैं.
3. Cloud Document AI API चालू करना
दस्तावेज़ एआई (AI) का इस्तेमाल शुरू करने से पहले, आपको एपीआई चालू करना होगा. अपने ब्राउज़र में Cloud Console खोलें.
- नेविगेशन मेन्यू रजिस्ट्रेंट पर क्लिक करें > एपीआई और सेवाएं > लाइब्रेरी.
- "Document AI API" खोजें. इसके बाद, अपने Google Cloud प्रोजेक्ट में एपीआई का इस्तेमाल करने के लिए, चालू करें पर क्लिक करें
4. प्रोसेसर बनाना और उसकी जांच करना
सबसे पहले आपको इस ट्यूटोरियल के लिए दस्तावेज़ AI Platform में इस्तेमाल करने के लिए फ़ॉर्म पार्सर प्रोसेसर का एक इंस्टेंस बनाना होगा.
- कंसोल में, दस्तावेज़ एआई प्लैटफ़ॉर्म की खास जानकारी पर जाएं
- प्रोसेसर बनाएं पर क्लिक करें और इनवॉइस पार्सर चुनें
- प्रोसेसर का नाम डालें और सूची में से अपना क्षेत्र चुनें.
- अपना प्रोसेसर बनाने के लिए, बनाएं पर क्लिक करें
- अपना प्रोसेसर आईडी कॉपी करें. आपको बाद में अपने कोड में इसका इस्तेमाल करना होगा.
(ज़रूरी नहीं) दस्तावेज़ अपलोड करके, कंसोल में अपने प्रोसेसर की जांच की जा सकती है. दस्तावेज़ अपलोड करें पर क्लिक करें और पार्स करने के लिए कोई फ़ॉर्म चुनें. अगर आपके पास इस्तेमाल के लिए कोई फ़ॉर्म नहीं है, तो इस सैंपल फ़ॉर्म को डाउनलोड करके इस्तेमाल किया जा सकता है.
आउटपुट ऐसा दिखना चाहिए:
5. AI Platform Notebook बनाना
अपने Cloud Console के AI Platform Notebooks सेक्शन पर जाएं और नया इंस्टेंस पर क्लिक करें. इसके बाद, Python का नया इंस्टेंस टाइप चुनें:
डिफ़ॉल्ट विकल्पों का इस्तेमाल करें और फिर बनाएं पर क्लिक करें. इंस्टेंस बनाने के बाद, JupyterLab खोलें को चुनें.
6. सैंपल कोड पाना
सीधे Docs AI Notebooks GitHub Repo से सैंपल कोड इंपोर्ट करें. अपनी नोटबुक में, Git पर जाएं > सबसे ऊपर दिए गए मेन्यू में, डेटा स्टोर करने की जगह का क्लोन बनाएं या Git आइकॉन पर क्लिक करें:
डेटा स्टोर करने की इस जगह का यूआरएल चिपकाएं:
https://github.com/GoogleCloudPlatform/documentai-notebooks.git
डेटा स्टोर करने की जगह को क्लोन करने के बाद, documentai-notebooks/specialized/ डायरेक्ट्री पर क्लिक करें और specialized_form_parser.ipynb
notebook खोलें. वह सेल ढूंढें जहां GCP प्रोजेक्ट और दस्तावेज़ एआई प्रोसेसर आईडी का एलान किया गया है.
चौथे चरण में दिया गया अपना GCP प्रोजेक्ट आईडी और प्रोसेसर आईडी चिपकाएं. अपनी नोटबुक सेव करें.
7. इकाइयों को एक्सट्रैक्ट करना और विज़ुअलाइज़ करना
अब इनवॉइस और उनसे जुड़े कॉन्फ़िडेंस स्कोर से स्कीमा में बनाई गई इकाइयां एक्सट्रैक्ट की जा सकती हैं. दस्तावेज़ के रिस्पॉन्स ऑब्जेक्ट में, इकाइयों की सूची होती है. स्कीमा वाली इकाइयों के बारे में ज़्यादा जानने के लिए, इनवॉइस पार्सर क्विकस्टार्ट पढ़ें.
अपनी नोटबुक में सभी सेल चलाएं और नीचे की ओर स्क्रोल करके टेबल के आउटपुट पर जाएं. हर इकाई में पहले से लागू कोड फिर से लागू होता है और नतीजों के साथ Pandas DataFrame बनाता है. अभी तक किसी भी व्यक्ति ने चेक इन नहीं किया है
अब नीचे की ओर स्क्रोल करके विज़ुअलाइज़ेशन कॉम्पोनेंट पर जाएं. दस्तावेज़ ऑब्जेक्ट के रिस्पॉन्स में, दस्तावेज़ के हर पेज के लिए जगह के हिसाब से लेआउट की जानकारी होती है. नीचे, हर फ़ॉर्म फ़ील्ड पर लेआउट की जानकारी का इस्तेमाल, इमेज पर बाउंडिंग बॉक्स बनाने के लिए किया गया है. इस डेटा का इस्तेमाल, दस्तावेज़ एआई (AI) को फ़्रंटएंड ऐप्लिकेशन में इंटिग्रेट करने के लिए किया जा सकता है.
8. बधाई हो
बधाई हो, आपने इनवॉइस से डेटा निकालने के लिए, Proक्योरमेंट डॉक्यूमेंट एआई सलूशन का इस्तेमाल कर लिया है. हमारा सुझाव है कि आप अन्य तरह के फ़ॉर्म आज़माएं.
स्टोरेज खाली करें
इस ट्यूटोरियल में इस्तेमाल किए गए संसाधनों के लिए, आपके Google Cloud खाते पर शुल्क न लगे. इसके लिए, अपनी नोटबुक बंद करें या GCP प्रोजेक्ट मिटाएं.
AI Platform Notebooks के इंस्टेंस को बंद करना
AI Platform Notebooks के इंस्टेंस को बंद करने के लिए, इन निर्देशों का पालन करें.
प्रोजेक्ट मिटाया जा रहा है
बिलिंग हटाने का सबसे आसान तरीका, ट्यूटोरियल के लिए बनाए गए प्रोजेक्ट को मिटाना है.
प्रोजेक्ट मिटाने के लिए:
- GCP कंसोल में, प्रोजेक्ट पेज पर जाएं. प्रोजेक्ट पेज
- प्रोजेक्ट की सूची में, वह प्रोजेक्ट चुनें जिसे आपको मिटाना है. इसके बाद, मिटाएं पर क्लिक करें.
- डायलॉग बॉक्स में, प्रोजेक्ट आईडी टाइप करें. इसके बाद, प्रोजेक्ट मिटाने के लिए शट डाउन करें पर क्लिक करें.