1. खास जानकारी
पेटेंट की रिसर्च बहुत बड़ी और जटिल होती है. काम के इनोवेशन ढूंढने के लिए, अनगिनत तकनीकी एब्स्ट्रैक्ट को छांटना एक मुश्किल काम है. कीवर्ड पर आधारित पारंपरिक खोजें अक्सर गलत होती हैं और इनमें समय भी लगता है. ऐब्स्ट्रैक्ट लंबे और तकनीकी होते हैं, जिनकी वजह से मूल आइडिया को जल्दी से समझना मुश्किल हो जाता है. इस वजह से, हो सकता है कि शोधकर्ताओं को अहम पेटेंट न मिलें या वे काम के नतीजों पर समय बर्बाद करें.
इस क्रांति का राज़, वेक्टर सर्च में है. सरल कीवर्ड मिलान पर निर्भर होने के बजाय, वेक्टर खोज, टेक्स्ट को संख्यात्मक निरूपणों (एम्बेडिंग) में बदल देती है. इसकी मदद से, हम क्वेरी के मतलब के आधार पर खोज कर सकते हैं, न कि सिर्फ़ इस्तेमाल किए गए खास शब्दों के आधार पर. साहित्य की दुनिया में, यह चीज़ बदल गई है. कल्पना करें कि आपको "पहने जाने वाले हृदय गति मॉनिटर" के लिए पेटेंट मिल गया है भले ही सटीक वाक्यांश का इस्तेमाल दस्तावेज़ में न किया गया हो.
चुनौती: आज के दौर में साहित्य से जुड़ी खोजों के लिए, लोगों को उनकी खास प्राथमिकताओं के हिसाब से तुरंत जवाब और बेहतर सुझाव देने की उम्मीद की जाती है. खोज के पारंपरिक तरीकों से, अक्सर इस लेवल पर खोज के नतीजे मनमुताबिक नहीं मिल पाते.
समाधान: हमारा नॉलेज-ड्रिवन चैट ऐप्लिकेशन, इस चुनौती का सीधा मुकाबला करता है. यह आपके पेटेंट डेटासेट से मिले नॉलेज बेस का फ़ायदा उठाता है, ताकि ग्राहक के इंटेंट को समझा जा सके, बेहतर जवाब दिए जा सकें, और ज़्यादा काम के नतीजे दिए जा सकें.
आपको क्या बनाना होगा
इस लैब (दूसरा चरण) में, आपको ये काम करने होंगे:
- Vertex AI Agent Builder एजेंट बनाएं
- AlloyDB टूल को एजेंट के साथ इंटिग्रेट करना
ज़रूरी शर्तें
2. आर्किटेक्चर
डेटा फ़्लो: आइए देखते हैं कि हमारे सिस्टम में, डेटा कैसे ट्रांसफ़र होता है:
डेटा डालना:
पेटेंट का डेटा, AlloyDB में लोड किया जाता है.
Analytics इंजन:
हम नीचे दिए गए काम करने के लिए, एनालिटिक्स इंजन के रूप में AlloyDB का इस्तेमाल करेंगे:
- कॉन्टेक्स्ट निकालना: इंजन, पैटेंट डेटासेट को समझने के लिए, AlloyDB में सेव किए गए डेटा का विश्लेषण करता है.
- एम्बेड करना क्रिएशन: एम्बेडिंग (टेक्स्ट का गणितीय निरूपण) उपयोगकर्ता की क्वेरी और AlloyDB में संग्रहित जानकारी दोनों के लिए जनरेट किया जाता है.
- वेक्टर खोज: इंजन एक समानता वाली खोज करता है, जिसमें क्वेरी एम्बेड करने की तुलना पेटेंट एब्सट्रैक्ट के एम्बेड से की जाती है. इससे, उपयोगकर्ता के खोजे गए कॉन्टेक्स्ट के सबसे काम के "नियरेस्ट नेबर" की पहचान की जाती है.
जवाब जनरेट करना:
पुष्टि किए गए जवाबों को JSON कलेक्शन में बांटा जाता है. साथ ही, पूरे इंजन को बिना सर्वर वाले Cloud Run फ़ंक्शन में पैकेज किया जाता है, जिसे Agent Builder से शुरू किया जाता है.
ऊपर दिए गए चरण, लैब के पहले हिस्से में पहले से ही शामिल हैं.
हमने नॉलेज-ड्रिवन ऐनलिटिक्स इंजन बनाने की तकनीकी जानकारी के बारे में बात की. यह इंजन, स्मार्ट पेटेंट सर्च असिस्टेंट को बेहतर बनाने में मदद करता है. आइए, अब यह देखते हैं कि हम Agent Builder की मदद से, बातचीत वाले इंटरफ़ेस में इस इंजन को कैसे लागू करते हैं. दूसरा चरण शुरू करने से पहले, पक्का करें कि आपके पास एंडपॉइंट यूआरएल तैयार है. इस लैब में हम अगले चरण के बारे में बताएंगे:
बातचीत:
एजेंट बिल्डर, उपयोगकर्ताओं को आम भाषा के फ़ॉर्मैट में जवाब दिखाता है, ताकि वे बाद में बातचीत कर सकें.
3. शुरू करने से पहले
प्रोजेक्ट बनाना
- Google Cloud Console में, प्रोजेक्ट चुनने वाले पेज पर, Google Cloud प्रोजेक्ट चुनें या बनाएं.
- पक्का करें कि आपके Cloud प्रोजेक्ट के लिए बिलिंग की सुविधा चालू हो. किसी प्रोजेक्ट के लिए बिलिंग की सुविधा चालू है या नहीं, यह देखने का तरीका जानें.
- आपको Cloud Shell का इस्तेमाल करना होगा. यह Google Cloud में चलने वाला एक कमांड-लाइन एनवायरमेंट है, जो पहले से लोड होता है. Google Cloud Console में सबसे ऊपर मौजूद, Cloud Shell को चालू करें पर क्लिक करें.
- Cloud Shell से कनेक्ट करने के बाद, यह जांच लें कि आपकी पुष्टि पहले ही हो चुकी है. साथ ही, यह भी देखें कि प्रोजेक्ट को आपके प्रोजेक्ट आईडी पर सेट करने के लिए, नीचे दिए गए निर्देश का इस्तेमाल किया गया हो:
gcloud auth list
- Cloud Shell में यह कमांड चलाकर पुष्टि करें कि gcloud कमांड को आपके प्रोजेक्ट के बारे में पता है.
gcloud config list project
- अगर आपका प्रोजेक्ट सेट नहीं है, तो इसे सेट करने के लिए इस निर्देश का इस्तेमाल करें:
gcloud config set project <YOUR_PROJECT_ID>
- ज़रूरी एपीआई चालू करें. कंसोल के ज़रिए, हर प्रॉडक्ट को खोजा जा सकता है या इस लिंक का इस्तेमाल किया जा सकता है.
अगर कोई एपीआई छूट जाता है, तो उसे लागू करने के दौरान कभी भी चालू किया जा सकता है.
gcloud के निर्देशों और इस्तेमाल के बारे में जानने के लिए, दस्तावेज़ देखें.
अहम जानकारी: साथ ही, यह भी पक्का करें कि आपने लैब का पहला चरण पूरा कर लिया हो.
4. एजेंट बनाना
पेश है एजेंट बिल्डर
एजेंट बिल्डर एक ऐसा बेहतरीन टूल है जिसमें कम कोड का इस्तेमाल किया जाता है. इसकी मदद से, बातचीत वाले एजेंट को तुरंत और आसानी से बनाया जा सकता है. इसकी मदद से, डायलॉग फ़्लो डिज़ाइन करने, नॉलेज बेस को इंटिग्रेट करने, और बाहरी एपीआई से कनेक्ट करने की प्रोसेस आसान हो जाती है. हमारे मामले में, हम एजेंट बिल्डर का इस्तेमाल करके, पार्ट 1 में बनाए गए Cloud Function एंडपॉइंट के साथ आसानी से कनेक्ट करेंगे. इससे हमारे पेटेंट सर्च असिस्टेंट को हमारे पेटेंट नॉलेज बेस को ऐक्सेस करने और उपयोगकर्ता की क्वेरी का बेहतर तरीके से जवाब देने में मदद मिलेगी.
पक्का करें कि आपके पास पहले चरण में बनाया गया Java Cloud Run फ़ंक्शन सादे टेक्स्ट के बजाय JSON कलेक्शन दिखा रहा हो.
एजेंट को तैयार करना
आइए, कपड़ों के प्रॉडक्ट के लिए उपयोगकर्ताओं के सवालों के जवाब देने वाला यह नया एजेंट बनाना शुरू करते हैं.
- Agent Builder प्लैटफ़ॉर्म पर लॉग इन करके शुरुआत करें. अगर आपसे एपीआई चालू करने के लिए कहा जाता है, तो 'जारी रखें और एपीआई चालू करें' पर क्लिक करें.
- "ऐप्लिकेशन बनाएं" पर क्लिक करें और अपने एजेंट को एक जानकारी देने वाला नाम दें (जैसे, "पेटेंट सर्च असिस्टेंट").
- ऐप्लिकेशन टाइप "एजेंट" पर क्लिक करें.
- को अपनाएं. अपने एजेंट को जानकारी देने वाला नाम दें, जैसे कि "Patent Search Assistant" और इलाके को us-central1 के तौर पर सेट करें
- एजेंट की जानकारी डालें:
- एजेंट का नाम बदलकर "पेटेंट सर्च एजेंट" करें.
- नीचे दिया गया "लक्ष्य" जोड़ें:
You are a professional intelligent patent search agent! Your job is to help the customer find patents matching the context of their search text.
- इसे इस समय सेव करें और निर्देशों को अभी खाली छोड़ दें.
- इसके बाद, नेविगेशन मेन्यू में 'टूल' पर क्लिक करें. इसके बाद, 'बनाएं' पर क्लिक करें.
टूल का नाम डालें: पेटेंट सर्च टूल
टाइप: OpenAPI
टूल की जानकारी डालें:
This tool refers to the dataset in the backend as the context information for product inventory. It takes as input the user's search text summarized by the agent and matches with the most appropriate list of items and returns as an array of items.
स्कीमा डालें — YAML फ़ॉर्मैट में OpenAPI:
इस हिस्से में हम एजेंट को चलाने के लिए बैकएंड एंडपॉइंट का इस्तेमाल करते हैं. नीचे दिया गया OpenAPI स्पेसिफ़िकेशन कॉपी करें और यूआरएल प्लेसहोल्डर (ऐंगल ब्रैकेट में शामिल) को अपने Cloud Function एंडपॉइंट से बदलें:
openapi: 3.0.0
info:
title: Patent Search API
version: v1
servers:
- url: YOUR_CLOUDFUNCTION_ENDPOINT_URL
paths:
/patent-search:
post:
summary: Search for patents using a text query.
requestBody:
content:
application/json:
schema:
type: object
properties:
search:
type: string
description: The text query to search for patents.
example: A new Natural Language Processing related Machine Learning Model
responses:
'200':
description: Successful search response with a JSON array of matching patents.
content:
application/json:
schema:
type: array
items:
type: object
properties:
result:
type: string
description: Patent title.
'400':
description: Invalid request body.
'500':
description: Internal server error.
अन्य कॉन्फ़िगरेशन को उनकी डिफ़ॉल्ट वैल्यू पर छोड़ दें और "सेव करें" पर क्लिक करें.
- अब एजेंट पर वापस जाएं, क्योंकि हमें एजेंट के "निर्देशों" में "टूल" कॉन्फ़िगरेशन जोड़ना है. नीचे दिए गए निर्देश प्लेसहोल्डर में, इंडेंट जोड़ें (ध्यान रखें कि फ़्लो तय करने के लिए, इंडेंट ज़रूरी हैं):
- Greet the users, then ask how you can help them today.
- Summarize the user's request and ask them to confirm that you understood correctly.
- If necessary, seek clarifying details.
- Use ${TOOL:Patent Search Tool} to help the user with their task.
- Return the response from the ${TOOL:Patent Search Tool} to the user in a well formed string.
- Thank the user for their business and say goodbye.
पक्का करें कि आपने "पेटेंट खोज टूल" टूल का इस्तेमाल किया हो को "उपलब्ध टूल" में चुना गया हो सेक्शन पर जा सकते हैं और फिर एजेंट को सेव कर सकते हैं.
5. एजेंट की जांच करना
दाएं पैनल में, आपको 'एजेंट की झलक देखें' सेक्शन दिखेगा. इसकी मदद से, अपने एजेंट की जांच की जा सकती है.
जैसा कि नीचे दिए गए स्क्रीनशॉट में देखा जा सकता है, मैंने उपयोगकर्ता के तौर पर नमस्ते कहा है और "फ़िटनेस ट्रैकर के किसी भी आइडिया के लिए मिलता-जुलता पेटेंट" का अनुरोध करके चैट शुरू की है:
JSON रिस्पॉन्स इस तरह का होता है:
यह Cloud फ़ंक्शन का रॉ JSON नतीजा है, जो AlloyDB मिलती-जुलती खोज को प्रोसेस करता है. हो गया! हम एजेंट से संपर्क कर चुके हैं.
6. डिप्लॉयमेंट और इंटिग्रेशन
एजेंट बनाने के बाद, उसे आसानी से अलग-अलग चैनलों पर डिप्लॉय किया जा सकता है. इसके लिए, एजेंट बिल्डर के इंटिग्रेशन का इस्तेमाल करें. इसे अपनी वेबसाइट पर एम्बेड किया जा सकता है, लोकप्रिय मैसेजिंग प्लैटफ़ॉर्म के साथ इंटिग्रेट किया जा सकता है या इसके लिए खास मोबाइल ऐप्लिकेशन भी बनाया जा सकता है. हम Agent Builder API का इस्तेमाल सीधे अपने वेब क्लाइंट ऐप्लिकेशन में भी कर सकते हैं. इस बारे में हमने इस ब्लॉग में बताया है.
7. व्यवस्थित करें
इस पोस्ट में इस्तेमाल किए गए संसाधनों के लिए, आपके Google Cloud खाते पर शुल्क न लगे, इसके लिए यह तरीका अपनाएं:
- Google Cloud Console में, मैनेज करें पर जाएं
- संसाधन पेज पर जाएं.
- प्रोजेक्ट की सूची में, वह प्रोजेक्ट चुनें जिसे मिटाना है. इसके बाद, मिटाएं पर क्लिक करें.
- डायलॉग बॉक्स में, प्रोजेक्ट आईडी लिखें और फिर प्रोजेक्ट मिटाने के लिए शट डाउन करें पर क्लिक करें.
8. बधाई हो
बधाई हो! हमने अपने कस्टम-बिल्ट किए गए आंकड़े इंजन को Agent Builder के आसान इंटरफ़ेस के साथ इंटिग्रेट किया है. इससे, हमने साहित्य की खोज के लिए एक बेहतर सहायक बनाई है. यह साहित्य की खोज को आसान, असरदार, और ज़्यादा काम का बनाती है. AlloyDB, Vertex AI और वेक्टर खोज की क्षमताओं को मिलाकर, हमने प्रासंगिक और वेक्टर खोजों को ऐक्सेस करने लायक, कुशल, असल में अर्थों से प्रेरित और एजेंटी बनाने की दिशा में एक बड़ा कदम उठाया है!