স্প্যানার, ভেক্টর অনুসন্ধান এবং সহ একটি পেটেন্ট অনুসন্ধান অ্যাপ তৈরি করুন; Gemini 1.0 Pro!

1. ওভারভিউ

বিভিন্ন শিল্প জুড়ে, পেটেন্ট গবেষণা প্রতিযোগিতামূলক ল্যান্ডস্কেপ বোঝার জন্য, সম্ভাব্য লাইসেন্সিং বা অধিগ্রহণের সুযোগ সনাক্ত করার জন্য এবং বিদ্যমান পেটেন্টগুলির লঙ্ঘন এড়ানোর জন্য একটি গুরুত্বপূর্ণ হাতিয়ার।

পেটেন্ট গবেষণা বিশাল এবং জটিল। প্রাসঙ্গিক উদ্ভাবন খুঁজে বের করার জন্য অগণিত প্রযুক্তিগত বিমূর্ত মাধ্যমে sifting একটি কঠিন কাজ. ঐতিহ্যগত কীওয়ার্ড-ভিত্তিক অনুসন্ধানগুলি প্রায়শই ভুল এবং সময়সাপেক্ষ হয়। বিমূর্তগুলি দীর্ঘ এবং প্রযুক্তিগত, এটি মূল ধারণাটি দ্রুত উপলব্ধি করা কঠিন করে তোলে। এর ফলে গবেষকরা মূল পেটেন্ট হারিয়ে ফেলতে পারে বা অপ্রাসঙ্গিক ফলাফলে সময় নষ্ট করতে পারে।

উদ্দেশ্য

এই কোডল্যাবে, আমরা স্প্যানার, এবং ইন-প্লেস জেমিনি 1.0 প্রো, এম্বেডিংস এবং ভেক্টর অনুসন্ধানের মাধ্যমে পেটেন্ট অনুসন্ধানের প্রক্রিয়াটিকে দ্রুত, আরও স্বজ্ঞাত, এবং অবিশ্বাস্যভাবে সুনির্দিষ্ট করার দিকে কাজ করব।

আপনি কি নির্মাণ করবেন

এই ল্যাবের অংশ হিসাবে, আপনি করবেন:

  1. একটি স্প্যানার উদাহরণ তৈরি করুন
  2. একটি Google পেটেন্ট পাবলিক ডেটাসেট লোড করুন
  3. Gemini 1.0 Pro মডেলের সাথে টেক্সট এম্বেডিংয়ের জন্য একটি দূরবর্তী মডেল তৈরি করুন
  4. লোড করা ডেটাসেট থেকে জেনারেটিভ ইনসাইট তৈরি করুন
  5. অন্তর্দৃষ্টি থেকে এম্বেডিং তৈরি করুন
  6. ডেটাসেটের বিরুদ্ধে সাদৃশ্য অনুসন্ধান প্রশ্নগুলি ইস্যু করুন৷

নিম্নলিখিত চিত্রটি তথ্যের প্রবাহ এবং বাস্তবায়নের সাথে জড়িত পদক্ষেপগুলিকে উপস্থাপন করে।

14cfdde5e24258a.png

প্রয়োজনীয়তা

2. আপনি শুরু করার আগে

একটি প্রকল্প তৈরি করুন

  1. Google ক্লাউড কনসোলে , প্রকল্প নির্বাচক পৃষ্ঠায়, একটি Google ক্লাউড প্রকল্প নির্বাচন করুন বা তৈরি করুন।
  2. নিশ্চিত করুন যে আপনার ক্লাউড প্রকল্পের জন্য বিলিং সক্ষম করা আছে৷ একটি প্রকল্পে বিলিং সক্ষম কিনা তা পরীক্ষা করতে শিখুন।
  3. আপনি ক্লাউড শেল ব্যবহার করবেন, Google ক্লাউডে চলমান একটি কমান্ড-লাইন পরিবেশ যা bq এর সাথে প্রিলোড করা হয়। গুগল ক্লাউড কনসোলের শীর্ষে সক্রিয় ক্লাউড শেল ক্লিক করুন।

ক্লাউড শেল বোতামের ছবি সক্রিয় করুন

  1. একবার ক্লাউড শেলের সাথে সংযুক্ত হয়ে গেলে, আপনি পরীক্ষা করে দেখুন যে আপনি ইতিমধ্যেই প্রমাণীকৃত হয়েছেন এবং নিম্নলিখিত কমান্ডটি ব্যবহার করে প্রকল্পটি আপনার প্রকল্প আইডিতে সেট করা আছে:
gcloud auth list
  1. gcloud কমান্ড আপনার প্রকল্প সম্পর্কে জানে তা নিশ্চিত করতে ক্লাউড শেলে নিম্নলিখিত কমান্ডটি চালান।
gcloud config list project
  1. যদি আপনার প্রজেক্ট সেট করা না থাকে, তাহলে এটি সেট করতে নিম্নলিখিত কমান্ডটি ব্যবহার করুন:
gcloud config set project <YOUR_PROJECT_ID>
  1. নিশ্চিত করুন যে Vertex AI এবং Spanner API গুলিকে কনসোলে অনুসন্ধান করে সক্ষম করা আছে৷ বিকল্পভাবে, আপনি ক্লাউড শেল টার্মিনালে নিম্নলিখিত কমান্ডটিও ব্যবহার করতে পারেন:
gcloud services enable spanner.googleapis.com --project <<YOUR_PROJECT_ID>>
gcloud services enable aiplatform.googleapis.com --project <<YOUR_PROJECT_ID>>

আরেকটি বিকল্প হল এই লিঙ্কটি ব্যবহার করা।

জিক্লাউড কমান্ড এবং ব্যবহারের জন্য ডকুমেন্টেশন পড়ুন।

3. আপনার স্প্যানার ডাটাবেস প্রস্তুত করুন

আসুন একটি স্প্যানার ইনস্ট্যান্স, ডাটাবেস এবং টেবিল তৈরি করি যেখানে পেটেন্ট ডেটাসেট লোড করা হবে।

একটি স্প্যানার উদাহরণ তৈরি করুন

  1. spanner-vertex নামে একটি স্প্যানার উদাহরণ তৈরি করুন।
gcloud spanner instances create spanner-vertex \
--config=regional-us-central1 \
--description=spanner-vertex \
--nodes=1

একটি ডাটাবেস তৈরি করুন

  1. Google ক্লাউড কনসোলে, স্প্যানার পৃষ্ঠাটি খুলুন।
  2. তালিকা থেকে spanner-vertex উদাহরণ নির্বাচন করুন।
  3. ডাটাবেসের অধীনে, ডেটাবেস তৈরি করুন ক্লিক করুন।
  4. পেটেন্টে ডাটাবেসের নাম সেট করুন।
  5. ডাটাবেস তৈরি করতে Create এ ক্লিক করুন।

একটি টেবিল তৈরি করুন

  1. Google ক্লাউড কনসোলে, স্প্যানার পৃষ্ঠাটি খুলুন।
  2. তালিকা থেকে spanner-vertex উদাহরণ নির্বাচন করুন।
  3. patents ডাটাবেস নির্বাচন করুন.
  4. টেবিল ট্যাবের অধীনে, টেবিল তৈরি করুন ক্লিক করুন। স্প্যানার স্টুডিও পৃষ্ঠা খোলে।
  5. নতুন এসকিউএল এডিটর ট্যাবে ক্লিক করে একটি নতুন ট্যাব খুলুন।
  6. নিম্নলিখিত ক্যোয়ারী চালান:
CREATE TABLE patents_data (
   id string(25), type string(25), number string(20), country string(2), date string(20), abstract string(300000), title string(100000),kind string(5), num_claims numeric, filename string(100), withdrawn numeric, 
) PRIMARY KEY (id);

4. ডাটাবেসে পেটেন্ট ডেটা লোড করুন

BigQuery-এ Google Patents পাবলিক ডেটাসেটগুলি আমাদের ডেটাসেট হিসাবে ব্যবহার করা হবে৷ আমরা আমাদের প্রশ্নগুলি চালানোর জন্য স্প্যানার স্টুডিও ব্যবহার করব। স্প্যানার-জেমিনি-সার্চ রিপোজিটরিতে insert_into_patents_data.sql স্ক্রিপ্ট রয়েছে যা আমরা পেটেন্ট ডেটা লোড করার জন্য চালাব।

  1. Google ক্লাউড কনসোলে, স্প্যানার পৃষ্ঠাটি খুলুন।
  2. তালিকা থেকে spanner-vertex উদাহরণ নির্বাচন করুন।
  3. patents ডাটাবেস নির্বাচন করুন.
  4. নেভিগেশন মেনুতে, স্প্যানার স্টুডিওতে ক্লিক করুন। এক্সপ্লোরার ফলক আপনার ডাটাবেসের বস্তুর একটি তালিকা প্রদর্শন করে।
  5. নতুন এসকিউএল এডিটর ট্যাবে ক্লিক করে একটি নতুন ট্যাব খুলুন।
  6. সম্পাদকের insert_into_patents_data.sql স্ক্রিপ্ট থেকে insert ক্যোয়ারী স্টেটমেন্ট কপি করুন। আপনি এই ব্যবহারের ক্ষেত্রে একটি দ্রুত ডেমোর জন্য 50-100টি সন্নিবেশ বিবৃতি অনুলিপি করতে পারেন।
  7. রান এ ক্লিক করুন। আপনার প্রশ্নের ফলাফল ফলাফল সারণীতে প্রদর্শিত হবে।

5. Gemini 1.0 Pro এর জন্য রিমোট মডেল তৈরি করুন৷

পেটেন্ট ডেটা ডাটাবেসে লোড হওয়ার পরে, আমরা একটি দূরবর্তী মডেল তৈরি করব যা শিরোনাম এবং কীওয়ার্ডগুলির একটি সংক্ষিপ্ত সেট তৈরি করতে Gemini 1.0 Pro Vertex AI মডেল ব্যবহার করে৷

স্প্যানার স্টুডিও এডিটরে নিম্নলিখিত ডিডিএল কমান্ড চালান:

  1. নেভিগেশন মেনুতে, স্প্যানার স্টুডিওতে ক্লিক করুন। এক্সপ্লোরার ফলক আপনার ডাটাবেসের বস্তুর একটি তালিকা প্রদর্শন করে।
  2. নতুন এসকিউএল এডিটর ট্যাবে ক্লিক করে একটি নতুন ট্যাব খুলুন।
  3. নিম্নলিখিত ক্যোয়ারী চালান:
CREATE MODEL gemini_pro_model INPUT(
prompt STRING(MAX),
) OUTPUT(
content STRING(MAX),
) REMOTE OPTIONS (
endpoint = '//aiplatform.googleapis.com/projects/<<YOUR_PROJECT_ID>>/locations/us-central1/publishers/google/models/gemini-pro',
default_batch_size = 1
);
  1. রান এ ক্লিক করুন। আপনার প্রশ্নের ফলাফল ফলাফল সারণীতে প্রদর্শিত হবে।

6. টেক্সট এম্বেডিংয়ের জন্য রিমোট মডেল তৈরি করুন

পূর্ববর্তী ধাপের ফলাফলে একটি শিরোনাম এবং কীওয়ার্ড সমন্বিত একটি সমন্বিত সারাংশ অন্তর্ভুক্ত রয়েছে। আমরা এই প্রতিক্রিয়াটিকে এমবেডিং-এ রূপান্তর করব যা আমাদেরকে একটি কোয়েরি চালানোর সময় উপযুক্ত মিল তৈরি করতে সাহায্য করবে। আমরা Spanner থেকে Vertex AI থেকে Text Embedding Gecko 003 model দূরবর্তীভাবে ব্যবহার করব।

  1. নেভিগেশন মেনুতে, স্প্যানার স্টুডিওতে ক্লিক করুন। এক্সপ্লোরার ফলক আপনার ডাটাবেসের বস্তুর একটি তালিকা প্রদর্শন করে।
  2. নতুন এসকিউএল এডিটর ট্যাবে ক্লিক করে একটি নতুন ট্যাব খুলুন।
  3. নিম্নলিখিত ক্যোয়ারী চালান:
CREATE MODEL text_embeddings INPUT(content STRING(MAX))
OUTPUT(
 embeddings
   STRUCT<
     statistics STRUCT<truncated BOOL, token_count FLOAT64>,
     values ARRAY<FLOAT64>>
)
REMOTE OPTIONS (
 endpoint = '//aiplatform.googleapis.com/projects/<<YOUR_PROJECT_ID>>/locations/us-central1/publishers/google/models/textembedding-gecko@003');
  1. রান এ ক্লিক করুন। আপনার প্রশ্নের ফলাফল ফলাফল সারণীতে প্রদর্শিত হবে।

7. পেটেন্ট অ্যাবস্ট্রাক্ট থেকে জেনারেটিভ ইনসাইট তৈরি করুন

আমরা একটি patents_data_gemini টেবিল তৈরি করব জেনারেটিভ অন্তর্দৃষ্টি সঞ্চয় করার জন্য যা আমরা জেমিনি 1.5 প্রো মডেল ব্যবহার করে তৈরি করব।

টেবিল তৈরি করুন

  1. নেভিগেশন মেনুতে, স্প্যানার স্টুডিওতে ক্লিক করুন। এক্সপ্লোরার ফলক আপনার ডাটাবেসের বস্তুর একটি তালিকা প্রদর্শন করে।
  2. নতুন এসকিউএল এডিটর ট্যাবে ক্লিক করে একটি নতুন ট্যাব খুলুন।
  3. নিম্নলিখিত ক্যোয়ারী চালান:
CREATE TABLE patents_data_gemini (id string(100), gemini_response STRING(MAX)) PRIMARY KEY (id);
  1. রান এ ক্লিক করুন। আপনার প্রশ্নের ফলাফল ফলাফল সারণীতে প্রদর্শিত হবে।

অন্তর্দৃষ্টি তৈরি করুন

জেনারেটিভ অন্তর্দৃষ্টি সহ সারণিটি পূরণ করতে, এটি সুপারিশ করা হয় যে আপনি এমন একটি অ্যাপ্লিকেশন ব্যবহার করুন যা ব্যাচ লিখন বা মিউটেশন পদ্ধতি ব্যবহার করে৷ এই কোডল্যাবের জন্য, আমরা টেবিলটি পূরণ করতে 4 বার পর্যন্ত নিম্নলিখিত DDL কোয়েরি চালাব।

INSERT INTO patents_data_gemini (id, gemini_response)
SELECT id, content as gemini_response
FROM ML.PREDICT(MODEL gemini_pro_model,
(select id, concat ('Identify the areas of work or keywords in this abstract', abstract) as prompt from patents_data b where id not in (select id from patents_data_gemini) limit 50
));

দ্রষ্টব্য: আপনি যদি এই ধাপে কোটা ছাড়িয়ে যাওয়া ত্রুটি পেয়ে থাকেন (ছোট মার্জিন ফ্রি-ক্রেডিটগুলির ক্ষেত্রে সম্ভব), সন্নিবেশটি এড়িয়ে যাওয়ার চেষ্টা করুন এবং নীচের সমাধান বিভাগে শুধুমাত্র নির্বাচিত প্রশ্নটি চালান৷

সমাধান বিভাগ:

SELECT id, content as gemini_response
FROM ML.PREDICT(MODEL gemini_pro_model,
(select id, concat ('Identify the areas of work or keywords in this abstract', abstract) as prompt from patents_data b limit 50
))

অন্তর্দৃষ্টি পর্যবেক্ষণ

সারণীতে অন্তর্দৃষ্টি রয়েছে যা 'Identify the areas of work or keywords in this abstract', প্রশ্নে প্রম্পট করার জন্য তৈরি করা হয়।

দ্রষ্টব্য: আপনি যদি INSERT DDL-এর পরিবর্তে উপরের ওয়ার্কআউন্ড সেকশন কোয়েরিটি চালান, তাহলে এই অংশটি এড়িয়ে যান এবং পরিবর্তে, এই পৃষ্ঠায় শেষ SELECT কোয়েরিটি চালান।

আসুন অন্তর্দৃষ্টির ফলাফল যাচাই করতে নিম্নলিখিত ক্যোয়ারী চালাই:

select title, abstract, gemini_response from patents_data a inner join patents_data_gemini b
on a.id = b.id;

নিম্নলিখিত ফলাফল দেখা যায়:

6041fab164aaab93.png

দ্রষ্টব্য: আপনি যদি ওয়ার্কঅ্যারাউন্ড বিভাগের ক্যোয়ারীটি চালান, তাহলে উপরের নির্বাচনী ক্যোয়ারীতে টেবিলের নামটিকে ওয়ার্কআরাউন্ড বিভাগে ক্যোয়ারী দিয়ে প্রতিস্থাপন করুন। সুতরাং আপনি পরিবর্তে নীচের চালাবেন:

select title, abstract, gemini_response from patents_data a inner join (SELECT id, content as gemini_response
FROM ML.PREDICT(MODEL gemini_pro_model,
(select id, concat ('Identify the areas of work or keywords in this abstract', abstract) as prompt from patents_data b limit 50
))) b
on a.id = b.id;

ফলাফল উপরের ফলাফলের স্ক্রিনশটের মতই হওয়া উচিত।

8. জেনারেট করা অন্তর্দৃষ্টিগুলির জন্য এম্বেডিং তৈরি করুন৷

আমাদের টেবিলে অন্তর্দৃষ্টিগুলি পূরণ করার পরে, আমরা এখন এম্বেডিং তৈরি করতে এই অন্তর্দৃষ্টিগুলি ব্যবহার করতে পারি। এই এমবেডিংগুলি আমাদেরকে সঠিক কীওয়ার্ড মিলের উপর নির্ভর না করতে সাহায্য করে, কিন্তু ধারণাগত মিলের উপর ভিত্তি করে ফলাফল তৈরি করতে সহায়তা করে।

দ্রষ্টব্য: আপনি যদি পূর্ববর্তী ধাপে ওয়ার্কঅ্যারাউন্ড সেকশন ক্যোয়ারী চালিয়ে থাকেন, তাহলে আপনি এটি এড়িয়ে যেতে পারেন এবং এই ধাপে ওয়ার্কঅ্যারাউন্ড বিভাগের ক্যোয়ারীতেও যেতে পারেন।

এমবেডিং তৈরি করতে নিম্নলিখিত ক্যোয়ারী চালান:

  1. নেভিগেশন মেনুতে, স্প্যানার স্টুডিওতে ক্লিক করুন। এক্সপ্লোরার ফলক আপনার ডাটাবেসের বস্তুর একটি তালিকা প্রদর্শন করে।
  2. নতুন এসকিউএল এডিটর ট্যাবে ক্লিক করে একটি নতুন ট্যাব খুলুন।
  3. patents_data_embeddings টেবিল তৈরি করতে নিম্নলিখিত ক্যোয়ারী চালান।
CREATE TABLE patents_data_embeddings (id string(100), patents_embeddings ARRAY<FLOAT64>) PRIMARY KEY (id);
  1. রান এ ক্লিক করুন। আপনার প্রশ্নের ফলাফল ফলাফল সারণীতে প্রদর্শিত হবে।
  2. এমবেডিং তৈরি করতে নিম্নলিখিত ক্যোয়ারী চালান।
INSERT INTO patents_data_embeddings (id, patents_embeddings)
SELECT id, embeddings.values as patents_embeddings
FROM ML.PREDICT(MODEL text_embeddings,
(SELECT id, gemini_response as content FROM patents_data_gemini));
  1. রান এ ক্লিক করুন। আপনার প্রশ্নের ফলাফল ফলাফল সারণীতে প্রদর্শিত হবে।

ফলাফল পর্যবেক্ষণ করুন

টেবিলে শিরোনাম এবং বিমূর্ত পাঠ্যের জন্য তৈরি করা এমবেডিং অন্তর্ভুক্ত রয়েছে।

আসুন ফলাফল যাচাই করতে নিম্নলিখিত ক্যোয়ারী চালাই:

select title, abstract, b.patents_embeddings from patents_data a inner join patents_data_embeddings b
on a.id = b.id;

নিম্নলিখিত ফলাফল দেখা যায়:

a1e968bac4ab1cb.png

সমাধান বিভাগ :

এই ক্যোয়ারীটি ব্যবহার করুন, যদি আপনি অন্যান্য ধাপে ওয়ার্কআউন্ড বিভাগটি করেন:

select title, abstract, b.patents_embeddings from patents_data a inner join 
(SELECT id, embeddings.values as patents_embeddings
FROM ML.PREDICT(MODEL text_embeddings,
(SELECT id, gemini_response as content FROM (SELECT id, content as gemini_response
FROM ML.PREDICT(MODEL gemini_pro_model,
(select id, concat ('Identify the areas of work or keywords in this abstract', abstract) as prompt from patents_data b limit 50
)))))) b
on a.id = b.id;

এটি উপরের স্ক্রিনশটে দেখানো হিসাবে একই ফলাফল পাওয়া উচিত।

9. ভেক্টর অনুসন্ধানের জন্য প্রস্তুত করুন

এখন যেহেতু আমরা টেক্সট এম্বেডিং তৈরি করেছি, আমরা আমাদের ওয়েব অ্যাপ্লিকেশনটিকে সাদৃশ্য ভেক্টর অনুসন্ধানগুলি সম্পাদন করার জন্য প্রস্তুত করতে পারি। এই কোডল্যাবে, আমরা একটি ওয়েব অ্যাপ্লিকেশান তৈরি করছি যাতে K-Nearest Neighbours Similarity Search ক্ষমতার উপর ভিত্তি করে সার্চের ফলাফল দেওয়ার যুক্তি রয়েছে৷ অনুসন্ধানের ফলাফলগুলি কীভাবে প্রদর্শিত হবে তা কল্পনা করতে আপনি একটি অনুসন্ধান অ্যাপের সাথে এই প্রস্তুত ডেটাসেটটি ব্যবহার করতে পারেন।

আমাদের কোডল্যাবের জন্য, আমরা একটি নমুনা কোয়েরি চালাব যা একটি প্রম্পটের জন্য অনুসন্ধান করে, প্রসঙ্গ ভিত্তিক ফলাফল তৈরি করে এবং ফলাফলগুলিকে 10টি এন্ট্রিতে সীমাবদ্ধ করে।

নিম্নলিখিত ক্যোয়ারী চালান:

  1. নেভিগেশন মেনুতে, স্প্যানার স্টুডিওতে ক্লিক করুন। এক্সপ্লোরার ফলক আপনার ডাটাবেসের বস্তুর একটি তালিকা প্রদর্শন করে।
  2. নতুন এসকিউএল এডিটর ট্যাবে ক্লিক করে একটি নতুন ট্যাব খুলুন।
  3. patents_data_embeddings টেবিল তৈরি করতে নিম্নলিখিত ক্যোয়ারী চালান।
SELECT a.id, a.title, a.abstract, 'A new Natural Language Processing related Machine Learning Model' search_text, COSINE_DISTANCE(c.patents_embeddings,
(SELECT embeddings.values
FROM ML.PREDICT(
MODEL text_embeddings,
(SELECT 'A new Natural Language Processing related Machine Learning Model' as content)))) as distance
FROM patents_data a inner join patents_data_gemini b on a.id = b.id
inner join patents_data_embeddings c on a.id = c.id
ORDER BY distance
LIMIT 10;
  1. রান এ ক্লিক করুন। আপনার প্রশ্নের ফলাফল ফলাফল সারণীতে প্রদর্শিত হবে।

দ্রষ্টব্য: আপনি যদি প্রথম দিকের সন্নিবেশ বিবৃতিগুলির মধ্যে একটিতে কোটা ত্রুটির কারণে সমাধান বিভাগে প্রশ্নগুলি ব্যবহার করেন, তবে আপনি অন্য সমস্ত পদক্ষেপগুলি এড়িয়ে যেতে পারেন এবং ভেক্টর এম্বেডিংগুলিতে নিকটতম প্রতিবেশী অনুসন্ধান সম্পাদনের ফলাফলগুলি পর্যবেক্ষণ করতে সরাসরি নীচের ক্যোয়ারীটি চালাতে পারেন স্প্যানার ডাটাবেস:

SELECT a.id, a.title, a.abstract, 'A new Natural Language Processing related Machine Learning Model' search_text, COSINE_DISTANCE(c.patents_embeddings,
(SELECT embeddings.values
FROM ML.PREDICT(
MODEL text_embeddings,
(SELECT 'A new Natural Language Processing related Machine Learning Model' as content)))) as distance
FROM patents_data a inner join (SELECT id, embeddings.values as patents_embeddings
FROM ML.PREDICT(MODEL text_embeddings,
(SELECT id, gemini_response as content FROM (SELECT id, content as gemini_response
FROM ML.PREDICT(MODEL gemini_pro_model,
(select id, concat ('Identify the areas of work or keywords in this abstract', abstract) as prompt from patents_data b 
)))))) c on a.id = c.id
ORDER BY distance
LIMIT 2;

ফলাফল পর্যবেক্ষণ করুন

আগের ক্যোয়ারীটি আমাদের প্রম্পটের জন্য নিকটতম 10টি মিল খুঁজে পেতে COSINE_DISTANCE পদ্ধতি ব্যবহার করে।

নিম্নলিখিত ফলাফল দেখা যায়:

d26ca8b8238bdf25.png

যে ফলাফলগুলি উত্পন্ন হয়েছে তা প্রম্পটের সাথে বেশ কাছাকাছি যা প্রশ্নের অংশ ছিল।

10. পরিষ্কার করুন

এই পোস্টে ব্যবহৃত সংস্থানগুলির জন্য আপনার Google ক্লাউড অ্যাকাউন্টে চার্জ এড়াতে, এই পদক্ষেপগুলি অনুসরণ করুন:

  1. Google ক্লাউড কনসোলে, সম্পদ পরিচালনা পৃষ্ঠাতে যান।
  2. প্রকল্প তালিকায়, আপনি যে প্রকল্পটি মুছতে চান সেটি নির্বাচন করুন এবং তারপরে মুছুন ক্লিক করুন। আপনি যদি প্রজেক্টটি মুছতে না চান, তাহলে শুধু স্প্যানারে আপনার তৈরি করা উদাহরণটি মুছুন।
  3. ডায়ালগে, প্রজেক্ট আইডি টাইপ করুন এবং তারপরে প্রোজেক্ট মুছে ফেলতে শাট ডাউন ক্লিক করুন।

11. অভিনন্দন

অভিনন্দন! আপনি সফলভাবে স্প্যানারের অন্তর্নির্মিত ভেক্টর অনুসন্ধান ব্যবহার করে একটি মিল অনুসন্ধান করেছেন৷ অতিরিক্তভাবে, আপনি দেখেছেন যে এসকিউএল ব্যবহার করে সরাসরি জেনারেটিভ এআই কার্যকারিতা প্রদান করতে এমবেডিং এবং এলএলএম মডেলগুলির সাথে কাজ করা কতটা সহজ।

এরপর কি?

স্প্যানারের সঠিক নিকটতম প্রতিবেশী (KNN ভেক্টর অনুসন্ধান) বৈশিষ্ট্য সম্পর্কে এখানে আরও জানুন: https://cloud.google.com/spanner/docs/find-k-nearest-neighbors

আপনি এখানে Spanner's VertexAI ইন্টিগ্রেশন ব্যবহার করে SQL এর সাথে অনলাইন ভবিষ্যদ্বাণীগুলি কীভাবে সম্পাদন করবেন সে সম্পর্কে আরও পড়তে পারেন: https://cloud.google.com/spanner/docs/ml