ডকুমেন্ট AI ওয়ারহাউস ব্যবহার করে ডকুমেন্ট ইনজেস্ট, প্রসেস এবং সার্চ করা

1. ওভারভিউ

ডকুমেন্ট এআই গুদাম কি?

ডকুমেন্ট এআই ওয়্যারহাউস নথি এবং তাদের কাঠামোগত মেটাডেটা সংরক্ষণ, অনুসন্ধান, সংগঠিত এবং বিশ্লেষণ করার একটি প্ল্যাটফর্ম। নথিতে ফর্ম এবং ইনভয়েসের মতো কাঠামোগত ডেটার পাশাপাশি চুক্তি এবং গবেষণাপত্রের মতো অসংগঠিত ডেটা অন্তর্ভুক্ত থাকতে পারে। নথিগুলির জন্য মেটাডেটা স্বয়ংক্রিয়ভাবে ডকুমেন্ট এআই-তে প্রসেসর ব্যবহার করে বা ক্ষেত্র এবং ট্যাগ ব্যবহার করে ম্যানুয়ালি ইনপুট ব্যবহার করে বের করা যেতে পারে।

এই কোডল্যাবে, আপনি ডকুমেন্ট এআই ওয়্যারহাউস ইউজার ইন্টারফেস ব্যবহার করে ডকুমেন্টগুলি কীভাবে ইনজেস্ট, প্রক্রিয়া এবং অনুসন্ধান করবেন তা শিখবেন। এই কোডল্যাবের জন্য নমুনা PDF নথি প্রদান করা হয়েছে, যার মধ্যে একটি লাইসেন্স চুক্তি, ঋণের ফর্ম এবং অর্ডার চালান রয়েছে।

পূর্বশর্ত

এই কোডল্যাব অন্যান্য ডকুমেন্ট এআই কোডল্যাবে উপস্থাপিত বিষয়বস্তুর উপর ভিত্তি করে তৈরি করে। এটি সুপারিশ করা হয় যে আপনি এগিয়ে যাওয়ার আগে নিম্নলিখিত ডকুমেন্টেশন এবং কোডল্যাবগুলি পড়ুন:

আপনি কি শিখবেন

  • ডকুমেন্ট এআই ওয়্যারহাউস এপিআই কীভাবে সক্ষম করবেন
  • ডকুমেন্ট এআই ওয়ারহাউসে ডকুমেন্ট প্রসেসর কীভাবে কনফিগার করবেন
  • কিভাবে বিভিন্ন ধরনের PDF ডকুমেন্টে টেক্সট আপলোড এবং পার্স করবেন
  • ডকুমেন্ট এআই ওয়্যারহাউসে কীভাবে নথি এবং তাদের মেটাডেটা অনুসন্ধান করবেন

আপনি কি প্রয়োজন হবে

2. নমুনা নথি ডাউনলোড করুন

এই কোডল্যাবের জন্য নমুনা PDF নথি প্রদান করা হয়েছে, যার মধ্যে একটি লাইসেন্স চুক্তি, ঋণের ফর্ম এবং অর্ডার চালান রয়েছে। আপনি এই কোডল্যাবে ব্যবহার করার জন্য নিম্নলিখিত নমুনা নথি ডাউনলোড করতে পারেন।

বিকল্পভাবে, আপনি gsutil ব্যবহার করে আমাদের সর্বজনীন Google ক্লাউড স্টোরেজ বাকেট থেকে নমুনা নথি ডাউনলোড করতে পারেন।

gsutil cp gs://cloud-samples-data/documentai/codelabs/warehouse/license-agreement.pdf .
gsutil cp gs://cloud-samples-data/documentai/codelabs/warehouse/loan-form.pdf .
gsutil cp gs://cloud-samples-data/documentai/codelabs/warehouse/order-invoice.pdf .

পরবর্তী ধাপে, আপনি এই নমুনা নথিগুলি আপলোড করবেন, বিভিন্ন নথি প্রসেসরের সাথে পার্স করবেন এবং ফলাফল নথি এবং মেটাডেটা ডকুমেন্ট এআই ওয়ারহাউসে সংরক্ষণ করবেন৷

3. ডকুমেন্ট AI ওয়্যারহাউস API সক্ষম করুন৷

আপনি ডকুমেন্ট এআই ওয়ারহাউস ব্যবহার শুরু করার আগে, আপনাকে অবশ্যই API সক্ষম করতে হবে।

ক্লাউড কনসোল ব্যবহার করে

  1. আপনার ব্রাউজারে Google ক্লাউড কনসোল খুলুন।
  2. Google ক্লাউড কনসোলে, API লাইব্রেরিতে নেভিগেট করে API এবং পরিষেবাগুলি ব্রাউজ করুন যা সক্ষম করা যেতে পারে৷
  3. API লাইব্রেরি পৃষ্ঠার শীর্ষে অনুসন্ধান বার ব্যবহার করে, Document AI Warehouse অনুসন্ধান করুন, তারপর ফলাফল পরিষেবাটিতে ক্লিক করুন৷
  4. আপনার Google ক্লাউড প্রজেক্টে ডকুমেন্ট এআই ওয়ারহাউস এপিআই সক্ষম করতে সক্ষম বোতামে ক্লিক করুন। নথি এআই গুদাম API

বিকল্প: gcloud CLI ব্যবহার করে

বিকল্পভাবে, নিম্নলিখিত gcloud কমান্ড ব্যবহার করে API সক্রিয় করা যেতে পারে:

gcloud services enable contentwarehouse.googleapis.com

যদি API সফলভাবে সক্ষম করা হয়, তাহলে আপনি নিম্নলিখিতগুলির মতো একটি বার্তা দেখতে পাবেন:

Operation "operations/..." finished successfully.

এখন, আপনি ডকুমেন্ট এআই ওয়ারহাউস ব্যবহার করতে প্রস্তুত!

4. ডকুমেন্ট এআই ওয়ারহাউস কনসোল দেখুন

আপনার ব্রাউজারে, https://documentwarehouse.cloud.google.com- এ অবস্থিত ডকুমেন্ট এআই ওয়ারহাউস কনসোলে নেভিগেট করুন (যা Google ক্লাউড কনসোলের বাহ্যিক)। নথিগুলি আপলোড, প্রক্রিয়া এবং অনুসন্ধান করার জন্য এই কোডল্যাবে অবশিষ্ট পদক্ষেপগুলি সম্পাদন করতে আপনি আপনার Google ক্লাউড প্রকল্পের সাথে ডকুমেন্ট এআই ওয়ারহাউস কনসোল ব্যবহার করবেন৷

নথি এআই গুদাম ড্যাশবোর্ড

ডকুমেন্ট এআই ওয়্যারহাউস আপনার প্রথমবার ব্যবহার করা হলে, আপনার প্রজেক্ট কনফিগার করার বিষয়ে আরও তথ্যের জন্য ডকুমেন্ট এআই ওয়ারহাউস ডকুমেন্টেশন দেখুন এবং আপনার প্রয়োজনের উপর নির্ভর করে সেটিংস।

5. একটি নথি স্কিমা তৈরি করুন

নথির স্কিমাগুলি নথির ধরন এবং নথিগুলির জন্য ক্ষেত্রগুলিকে সংজ্ঞায়িত করে যা আপনি নথি AI ওয়্যারহাউসে সংরক্ষণ করেন৷ কোনো নতুন নথি আপলোড করার আগে আপনাকে একটি স্কিমা তৈরি করতে হবে।

  1. ডকুমেন্ট এআই ওয়্যারহাউস কনসোল থেকে, পৃষ্ঠার উপরের ডানদিকে অ্যাডমিন বোতামে ক্লিক করুন।
  2. বাম নেভিগেশন বারে স্কিমা আইটেমটি ক্লিক করুন, তারপর + নতুন বোতামে ক্লিক করুন।
  3. আপনার স্কিমার জন্য একটি নাম লিখুন, যেমন Documents and Forms , এবং নিশ্চিত করুন যে ডকুমেন্টটি স্কিমা টাইপ হিসাবে নির্বাচিত হয়েছে। তারপর, চালিয়ে যেতে পরবর্তী বোতামে ক্লিক করুন।
  4. আপনি ডিফল্ট JSON স্কিমা সংজ্ঞাটি রেখে দিতে পারেন, যা নিম্নলিখিত হিসাবে উপস্থিত হওয়া উচিত:
    {
      "display_name": "Documents and Forms",
      "property_definitions": [],
      "document_is_folder": false,
      "description": ""
    }
    
  5. তারপর ডকুমেন্ট স্কিমা তৈরি করা শেষ করতে সম্পন্ন বোতামে ক্লিক করুন।

এই পদক্ষেপগুলি সফলভাবে সমাপ্ত করার পরে, আপনি একটি বার্তা দেখতে পাবেন যে আপনার নথির স্কিমা তৈরি করা হয়েছে। আপনি দেখুন ডকুমেন্ট স্কিমা বোতামে ক্লিক করতে পারেন, তারপর স্কিমা নিশ্চিত করতে JSON ট্যাবে ক্লিক করতে পারেন, যা নিম্নলিখিতগুলির মতো দেখা উচিত:

ডকুমেন্ট স্কিমা

6. ডকুমেন্ট প্রসেসর তৈরি করুন

এই ধাপে, আপনি ডকুমেন্ট প্রসেসর তৈরি করবেন যা আপনি ডকুমেন্ট এআই ওয়্যারহাউসে বিভিন্ন ধরনের নথিতে পূর্ণ-পাঠ্য অনুসন্ধান করতে ব্যবহার করতে পারেন।

  1. Google ক্লাউড কনসোলে, ডকুমেন্ট এআই প্ল্যাটফর্ম ওভারভিউ পৃষ্ঠাতে নেভিগেট করুন।
  2. এক্সপ্লোর প্রসেসর ক্লিক করুন, তৈরি করতে প্রসেসরের ধরন হিসাবে নথি ওসিআর নির্বাচন করুন।
  3. আপনার ডকুমেন্ট প্রসেসরের জন্য একটি নাম উল্লেখ করুন যেমন ocr এবং আপনার পছন্দের অঞ্চল, তারপর আপনার প্রসেসর তৈরি করতে তৈরি করুন ক্লিক করুন।
  4. প্রসেসরের বিবরণ পৃষ্ঠায়, প্রসেসর আইডি অনুলিপি করুন, যা আমরা পরে ডকুমেন্ট এআই ওয়ারহাউসে একটি প্রসেসর কনফিগার করতে ব্যবহার করব।

এই পদক্ষেপগুলি পুনরাবৃত্তি করুন এবং প্রসেসরের নাম হিসাবে form তৈরি এবং নির্দিষ্ট করতে নথি প্রসেসরের ধরন হিসাবে ফর্ম পার্সার নির্বাচন করুন৷

এই পদক্ষেপগুলি পুনরাবৃত্তি করুন এবং প্রসেসরের নাম হিসাবে invoice তৈরি এবং নির্দিষ্ট করতে নথি প্রসেসরের ধরন হিসাবে চালান পার্সার নির্বাচন করুন৷

এই পদক্ষেপগুলি সফলভাবে সমাপ্ত করার পরে, আপনাকে নিম্নলিখিতগুলির মতো দেখতে নথি প্রসেসরগুলির একটি তালিকা দেখতে হবে:

ডকুমেন্ট প্রসেসর

7. ডকুমেন্ট প্রসেসর কনফিগার করুন

এই ধাপে, আপনি আগের ধাপে তৈরি করা প্রসেসরের উল্লেখ করে ডকুমেন্ট এআই ওয়ারহাউসে ডকুমেন্ট প্রসেসর কনফিগার করবেন।

  1. ডকুমেন্ট এআই ওয়ারহাউস কনসোল থেকে, উপরের টুলবারে অ্যাডমিন বোতামে ক্লিক করুন।
  2. বাম নেভিগেশন বারে ডক এআই প্রসেসর আইটেমটি ক্লিক করুন, তারপরে + নতুন বোতামে ক্লিক করুন।
  3. + নতুন প্রসেসর যোগ করুন বোতামে ক্লিক করুন, তারপর পূর্ববর্তী ধাপ থেকে একটি নাম এবং প্রসেসর আইডি উল্লেখ করুন।
  4. আপনার পরিবর্তনগুলি সংরক্ষণ করতে সংরক্ষণ বোতামে ক্লিক করুন।

ফর্ম পার্সার এবং ইনভয়েস পার্সার সহ + নতুন প্রসেসর যোগ করুন বোতাম ব্যবহার করে ডকুমেন্ট এআই ওয়ারহাউস কনফিগারেশনে অন্য দুটি প্রসেসর যুক্ত করতে এই পদক্ষেপগুলি পুনরাবৃত্তি করুন। নিশ্চিত করুন যে আপনি + নতুন প্রসেসর যোগ করুন বোতাম ব্যবহার করে একই ডকুমেন্ট স্কিমা আইডির অধীনে দুটি অতিরিক্ত প্রসেসর যোগ করেছেন, + নতুন যোগ করুন বোতাম ব্যবহার করে একটি অতিরিক্ত স্কিমা যোগ করার পরিবর্তে।

এই পদক্ষেপগুলি সফলভাবে সমাপ্ত করার পরে, আপনি কনফিগার করা ডকুমেন্ট প্রসেসরগুলির একটি তালিকা দেখতে পাবেন যা নিম্নলিখিতগুলির মতো দেখায়:

ডকুমেন্ট এআই ওয়্যারহাউসে ডকুমেন্ট প্রসেসর

8. আপলোড এবং নমুনা নথি প্রক্রিয়া

এখন আপনি আপনার নথিগুলির জন্য একটি স্কিমা এবং কনফিগার করা প্রসেসর সংজ্ঞায়িত করেছেন, আপনি ডকুমেন্ট এআই ওয়ারহাউসে নথি আপলোড করতে পারেন৷

  1. ডকুমেন্ট এআই ওয়ারহাউস কনসোলে ফিরে যান এবং বাম নেভিগেশন বারে +নতুন যোগ করুন বোতামে ক্লিক করুন, তারপর একটি নতুন নথি আপলোড করার বিকল্পটি নির্বাচন করুন।
  2. আপলোড উইজেটে আপনার মেশিন থেকে লাইসেন্স-এগ্রিমেন্ট.পিডিএফ ডকুমেন্টটি টেনে আনুন, অথবা আপনার ডাউনলোড করা নমুনা নথিগুলির একটি ব্রাউজ করুন এবং নির্বাচন করুন। তারপর, চালিয়ে যেতে পরবর্তী বোতামে ক্লিক করুন।
  3. ডকুমেন্ট স্কিমার জন্য, আপনি আগে যে স্কিমার তৈরি করেছেন তার নাম নির্বাচন করুন, যেমন ডকুমেন্টস এবং ফর্মডক এআই প্রসেসর আইডির জন্য, আগের ধাপে আপনি কনফিগার করা OCR ডকুমেন্ট প্রসেসর নির্বাচন করুন।
  4. প্রদর্শন নামের জন্য, আপনি ডিফল্ট নাম (অর্থাৎ ফাইলের নাম) ব্যবহার করতে পারেন, অথবা আপনার নিজস্ব কাস্টম নথির নাম ব্যবহার করতে পারেন।
  5. আপনার নথি আপলোড এবং প্রক্রিয়া করতে তৈরি বোতামে ক্লিক করুন।

ডকুমেন্ট এআই ওয়ারহাউস কনসোলে ফিরে যান এবং লোন-ফর্ম.পিডিএফ নমুনা নথির সাথে এই ধাপগুলি পুনরাবৃত্তি করুন। আপনি পূর্বে কনফিগার করা form নথি প্রসেসর নির্বাচন করুন.

ডকুমেন্ট এআই ওয়ারহাউস কনসোলে ফিরে যান এবং ইনভয়েস-sample.pdf নমুনা নথির সাথে এই ধাপগুলি পুনরাবৃত্তি করুন। invoice ডকুমেন্ট প্রসেসর নির্বাচন করুন যা আপনি আগে কনফিগার করেছেন।

এই পদক্ষেপগুলি সফলভাবে সমাপ্ত করার পরে, আপনি যদি ডকুমেন্ট এআই ওয়্যারহাউস কনসোলে ফিরে যান, তাহলে আপনাকে প্রক্রিয়াকৃত নথিগুলির একটি তালিকা দেখতে হবে যা নিম্নলিখিতগুলির মতো দেখায়:

ডকুমেন্ট এআই গুদামে প্রক্রিয়াকৃত নথি

9. অনুসন্ধান এবং নথি অন্বেষণ

এখন আপনি ডকুমেন্ট এআই ওয়্যারহাউসে একটি নথি আপলোড এবং প্রক্রিয়াকরণ করেছেন, আপনি নথিতে একটি পূর্ণ-পাঠ্য অনুসন্ধান করতে পারেন।

ডকুমেন্ট এআই ওয়ারহাউস কনসোল থেকে, নমুনা নথিতে প্রদর্শিত একটি অনুসন্ধান শব্দ লিখুন যেমন agreement , তারপর এন্টার কী টিপুন। আপনি আপলোড করা বিভিন্ন নমুনা নথির ফলাফল দেখতে mortgage এবং monitor মতো অন্যান্য অনুসন্ধানের অনুসন্ধানগুলি চেষ্টা করতে পারেন৷

ফলাফলগুলিতে, আপনি সেই অনুসন্ধান শব্দটি ধারণ করে এমন সমস্ত নথি দেখতে পাবেন, সাথে অনুসন্ধান শব্দটি হাইলাইট করা নথির পাঠ্যের সারাংশ সহ:

নথি এআই গুদাম অনুসন্ধান ফলাফল

এটি দেখতে একটি নথির নামের উপর ক্লিক করুন.

সনাক্ত করা ক্ষেত্র এবং তাদের সম্পর্কিত ডেটা সহ নথিটি দেখতে AI ভিউ টগলটিতে ক্লিক করুন:

ডকুমেন্ট এআই ওয়ারহাউসে বিস্তারিত দেখুন

10. অভিনন্দন

আপনি ডকুমেন্ট এআই ওয়্যারহাউস এবং ডকুমেন্ট এআই-তে প্রসেসর ব্যবহার করে ডকুমেন্টে সফলভাবে আপলোড করেছেন, প্রক্রিয়া করেছেন এবং পূর্ণ-পাঠ্য অনুসন্ধান করেছেন। আমরা আপনাকে অন্যান্য নথি নিয়ে পরীক্ষা করতে এবং প্ল্যাটফর্মে উপলব্ধ অন্যান্য প্রসেসরগুলি অন্বেষণ করতে উত্সাহিত করি৷

ক্লিন আপ

এই টিউটোরিয়ালে ব্যবহৃত সংস্থানগুলির জন্য আপনার Google ক্লাউড অ্যাকাউন্টে চার্জ এড়াতে আপনি নিম্নলিখিত পরিষ্কার করতে পারেন:

আরও জানুন

এই অন্যান্য কোডল্যাবগুলির সাথে ডকুমেন্ট এআই সম্পর্কে শেখা চালিয়ে যান।

সম্পদ

লাইসেন্স

এই কাজটি ক্রিয়েটিভ কমন্স অ্যাট্রিবিউশন 2.0 জেনেরিক লাইসেন্সের অধীনে লাইসেন্সপ্রাপ্ত।