1. ওভারভিউ
ডকুমেন্ট এআই গুদাম কি?
ডকুমেন্ট এআই ওয়্যারহাউস নথি এবং তাদের কাঠামোগত মেটাডেটা সংরক্ষণ, অনুসন্ধান, সংগঠিত এবং বিশ্লেষণ করার একটি প্ল্যাটফর্ম। নথিতে ফর্ম এবং ইনভয়েসের মতো কাঠামোগত ডেটার পাশাপাশি চুক্তি এবং গবেষণাপত্রের মতো অসংগঠিত ডেটা অন্তর্ভুক্ত থাকতে পারে। নথিগুলির জন্য মেটাডেটা স্বয়ংক্রিয়ভাবে ডকুমেন্ট এআই-তে প্রসেসর ব্যবহার করে বা ক্ষেত্র এবং ট্যাগ ব্যবহার করে ম্যানুয়ালি ইনপুট ব্যবহার করে বের করা যেতে পারে।
এই কোডল্যাবে, আপনি ডকুমেন্ট এআই ওয়্যারহাউস ইউজার ইন্টারফেস ব্যবহার করে ডকুমেন্টগুলি কীভাবে ইনজেস্ট, প্রক্রিয়া এবং অনুসন্ধান করবেন তা শিখবেন। এই কোডল্যাবের জন্য নমুনা PDF নথি প্রদান করা হয়েছে, যার মধ্যে একটি লাইসেন্স চুক্তি, ঋণের ফর্ম এবং অর্ডার চালান রয়েছে।
পূর্বশর্ত
এই কোডল্যাব অন্যান্য ডকুমেন্ট এআই কোডল্যাবে উপস্থাপিত বিষয়বস্তুর উপর ভিত্তি করে তৈরি করে। এটি সুপারিশ করা হয় যে আপনি এগিয়ে যাওয়ার আগে নিম্নলিখিত ডকুমেন্টেশন এবং কোডল্যাবগুলি পড়ুন:
- কুইকস্টার্ট: ডকুমেন্ট এআই এপিআই সেট আপ করুন
- Google ক্লাউড কনসোল ব্যবহার করে ডকুমেন্ট প্রসেস করুন
- পাইথনের সাথে ডকুমেন্ট এআই প্রসেসর পরিচালনা করা
আপনি কি শিখবেন
- ডকুমেন্ট এআই ওয়্যারহাউস এপিআই কীভাবে সক্ষম করবেন
- ডকুমেন্ট এআই ওয়ারহাউসে ডকুমেন্ট প্রসেসর কীভাবে কনফিগার করবেন
- কিভাবে বিভিন্ন ধরনের PDF ডকুমেন্টে টেক্সট আপলোড এবং পার্স করবেন
- ডকুমেন্ট এআই ওয়্যারহাউসে কীভাবে নথি এবং তাদের মেটাডেটা অনুসন্ধান করবেন
আপনি কি প্রয়োজন হবে
- একটি Google ক্লাউড প্রকল্প
- একটি ব্রাউজার, যেমন ক্রোম বা ফায়ারফক্স
2. নমুনা নথি ডাউনলোড করুন
এই কোডল্যাবের জন্য নমুনা PDF নথি প্রদান করা হয়েছে, যার মধ্যে একটি লাইসেন্স চুক্তি, ঋণের ফর্ম এবং অর্ডার চালান রয়েছে। আপনি এই কোডল্যাবে ব্যবহার করার জন্য নিম্নলিখিত নমুনা নথি ডাউনলোড করতে পারেন।
বিকল্পভাবে, আপনি gsutil
ব্যবহার করে আমাদের সর্বজনীন Google ক্লাউড স্টোরেজ বাকেট থেকে নমুনা নথি ডাউনলোড করতে পারেন।
gsutil cp gs://cloud-samples-data/documentai/codelabs/warehouse/license-agreement.pdf .
gsutil cp gs://cloud-samples-data/documentai/codelabs/warehouse/loan-form.pdf .
gsutil cp gs://cloud-samples-data/documentai/codelabs/warehouse/order-invoice.pdf .
পরবর্তী ধাপে, আপনি এই নমুনা নথিগুলি আপলোড করবেন, বিভিন্ন নথি প্রসেসরের সাথে পার্স করবেন এবং ফলাফল নথি এবং মেটাডেটা ডকুমেন্ট এআই ওয়ারহাউসে সংরক্ষণ করবেন৷
3. ডকুমেন্ট AI ওয়্যারহাউস API সক্ষম করুন৷
আপনি ডকুমেন্ট এআই ওয়ারহাউস ব্যবহার শুরু করার আগে, আপনাকে অবশ্যই API সক্ষম করতে হবে।
ক্লাউড কনসোল ব্যবহার করে
- আপনার ব্রাউজারে Google ক্লাউড কনসোল খুলুন।
- Google ক্লাউড কনসোলে, API লাইব্রেরিতে নেভিগেট করে API এবং পরিষেবাগুলি ব্রাউজ করুন যা সক্ষম করা যেতে পারে৷
- API লাইব্রেরি পৃষ্ঠার শীর্ষে অনুসন্ধান বার ব্যবহার করে,
Document AI Warehouse
অনুসন্ধান করুন, তারপর ফলাফল পরিষেবাটিতে ক্লিক করুন৷ - আপনার Google ক্লাউড প্রজেক্টে ডকুমেন্ট এআই ওয়ারহাউস এপিআই সক্ষম করতে সক্ষম বোতামে ক্লিক করুন।
বিকল্প: gcloud CLI ব্যবহার করে
বিকল্পভাবে, নিম্নলিখিত gcloud
কমান্ড ব্যবহার করে API সক্রিয় করা যেতে পারে:
gcloud services enable contentwarehouse.googleapis.com
যদি API সফলভাবে সক্ষম করা হয়, তাহলে আপনি নিম্নলিখিতগুলির মতো একটি বার্তা দেখতে পাবেন:
Operation "operations/..." finished successfully.
এখন, আপনি ডকুমেন্ট এআই ওয়ারহাউস ব্যবহার করতে প্রস্তুত!
4. ডকুমেন্ট এআই ওয়ারহাউস কনসোল দেখুন
আপনার ব্রাউজারে, https://documentwarehouse.cloud.google.com- এ অবস্থিত ডকুমেন্ট এআই ওয়ারহাউস কনসোলে নেভিগেট করুন (যা Google ক্লাউড কনসোলের বাহ্যিক)। নথিগুলি আপলোড, প্রক্রিয়া এবং অনুসন্ধান করার জন্য এই কোডল্যাবে অবশিষ্ট পদক্ষেপগুলি সম্পাদন করতে আপনি আপনার Google ক্লাউড প্রকল্পের সাথে ডকুমেন্ট এআই ওয়ারহাউস কনসোল ব্যবহার করবেন৷
ডকুমেন্ট এআই ওয়্যারহাউস আপনার প্রথমবার ব্যবহার করা হলে, আপনার প্রজেক্ট কনফিগার করার বিষয়ে আরও তথ্যের জন্য ডকুমেন্ট এআই ওয়ারহাউস ডকুমেন্টেশন দেখুন এবং আপনার প্রয়োজনের উপর নির্ভর করে সেটিংস।
5. একটি নথি স্কিমা তৈরি করুন
নথির স্কিমাগুলি নথির ধরন এবং নথিগুলির জন্য ক্ষেত্রগুলিকে সংজ্ঞায়িত করে যা আপনি নথি AI ওয়্যারহাউসে সংরক্ষণ করেন৷ কোনো নতুন নথি আপলোড করার আগে আপনাকে একটি স্কিমা তৈরি করতে হবে।
- ডকুমেন্ট এআই ওয়্যারহাউস কনসোল থেকে, পৃষ্ঠার উপরের ডানদিকে অ্যাডমিন বোতামে ক্লিক করুন।
- বাম নেভিগেশন বারে স্কিমা আইটেমটি ক্লিক করুন, তারপর + নতুন বোতামে ক্লিক করুন।
- আপনার স্কিমার জন্য একটি নাম লিখুন, যেমন
Documents and Forms
, এবং নিশ্চিত করুন যে ডকুমেন্টটি স্কিমা টাইপ হিসাবে নির্বাচিত হয়েছে। তারপর, চালিয়ে যেতে পরবর্তী বোতামে ক্লিক করুন। - আপনি ডিফল্ট JSON স্কিমা সংজ্ঞাটি রেখে দিতে পারেন, যা নিম্নলিখিত হিসাবে উপস্থিত হওয়া উচিত:
{ "display_name": "Documents and Forms", "property_definitions": [], "document_is_folder": false, "description": "" }
- তারপর ডকুমেন্ট স্কিমা তৈরি করা শেষ করতে সম্পন্ন বোতামে ক্লিক করুন।
এই পদক্ষেপগুলি সফলভাবে সমাপ্ত করার পরে, আপনি একটি বার্তা দেখতে পাবেন যে আপনার নথির স্কিমা তৈরি করা হয়েছে। আপনি দেখুন ডকুমেন্ট স্কিমা বোতামে ক্লিক করতে পারেন, তারপর স্কিমা নিশ্চিত করতে JSON ট্যাবে ক্লিক করতে পারেন, যা নিম্নলিখিতগুলির মতো দেখা উচিত:
6. ডকুমেন্ট প্রসেসর তৈরি করুন
এই ধাপে, আপনি ডকুমেন্ট প্রসেসর তৈরি করবেন যা আপনি ডকুমেন্ট এআই ওয়্যারহাউসে বিভিন্ন ধরনের নথিতে পূর্ণ-পাঠ্য অনুসন্ধান করতে ব্যবহার করতে পারেন।
- Google ক্লাউড কনসোলে, ডকুমেন্ট এআই প্ল্যাটফর্ম ওভারভিউ পৃষ্ঠাতে নেভিগেট করুন।
- এক্সপ্লোর প্রসেসর ক্লিক করুন, তৈরি করতে প্রসেসরের ধরন হিসাবে নথি ওসিআর নির্বাচন করুন।
- আপনার ডকুমেন্ট প্রসেসরের জন্য একটি নাম উল্লেখ করুন যেমন
ocr
এবং আপনার পছন্দের অঞ্চল, তারপর আপনার প্রসেসর তৈরি করতে তৈরি করুন ক্লিক করুন। - প্রসেসরের বিবরণ পৃষ্ঠায়, প্রসেসর আইডি অনুলিপি করুন, যা আমরা পরে ডকুমেন্ট এআই ওয়ারহাউসে একটি প্রসেসর কনফিগার করতে ব্যবহার করব।
এই পদক্ষেপগুলি পুনরাবৃত্তি করুন এবং প্রসেসরের নাম হিসাবে form
তৈরি এবং নির্দিষ্ট করতে নথি প্রসেসরের ধরন হিসাবে ফর্ম পার্সার নির্বাচন করুন৷
এই পদক্ষেপগুলি পুনরাবৃত্তি করুন এবং প্রসেসরের নাম হিসাবে invoice
তৈরি এবং নির্দিষ্ট করতে নথি প্রসেসরের ধরন হিসাবে চালান পার্সার নির্বাচন করুন৷
এই পদক্ষেপগুলি সফলভাবে সমাপ্ত করার পরে, আপনাকে নিম্নলিখিতগুলির মতো দেখতে নথি প্রসেসরগুলির একটি তালিকা দেখতে হবে:
7. ডকুমেন্ট প্রসেসর কনফিগার করুন
এই ধাপে, আপনি আগের ধাপে তৈরি করা প্রসেসরের উল্লেখ করে ডকুমেন্ট এআই ওয়ারহাউসে ডকুমেন্ট প্রসেসর কনফিগার করবেন।
- ডকুমেন্ট এআই ওয়ারহাউস কনসোল থেকে, উপরের টুলবারে অ্যাডমিন বোতামে ক্লিক করুন।
- বাম নেভিগেশন বারে ডক এআই প্রসেসর আইটেমটি ক্লিক করুন, তারপরে + নতুন বোতামে ক্লিক করুন।
- + নতুন প্রসেসর যোগ করুন বোতামে ক্লিক করুন, তারপর পূর্ববর্তী ধাপ থেকে একটি নাম এবং প্রসেসর আইডি উল্লেখ করুন।
- আপনার পরিবর্তনগুলি সংরক্ষণ করতে সংরক্ষণ বোতামে ক্লিক করুন।
ফর্ম পার্সার এবং ইনভয়েস পার্সার সহ + নতুন প্রসেসর যোগ করুন বোতাম ব্যবহার করে ডকুমেন্ট এআই ওয়ারহাউস কনফিগারেশনে অন্য দুটি প্রসেসর যুক্ত করতে এই পদক্ষেপগুলি পুনরাবৃত্তি করুন। নিশ্চিত করুন যে আপনি + নতুন প্রসেসর যোগ করুন বোতাম ব্যবহার করে একই ডকুমেন্ট স্কিমা আইডির অধীনে দুটি অতিরিক্ত প্রসেসর যোগ করেছেন, + নতুন যোগ করুন বোতাম ব্যবহার করে একটি অতিরিক্ত স্কিমা যোগ করার পরিবর্তে।
এই পদক্ষেপগুলি সফলভাবে সমাপ্ত করার পরে, আপনি কনফিগার করা ডকুমেন্ট প্রসেসরগুলির একটি তালিকা দেখতে পাবেন যা নিম্নলিখিতগুলির মতো দেখায়:
8. আপলোড এবং নমুনা নথি প্রক্রিয়া
এখন আপনি আপনার নথিগুলির জন্য একটি স্কিমা এবং কনফিগার করা প্রসেসর সংজ্ঞায়িত করেছেন, আপনি ডকুমেন্ট এআই ওয়ারহাউসে নথি আপলোড করতে পারেন৷
- ডকুমেন্ট এআই ওয়ারহাউস কনসোলে ফিরে যান এবং বাম নেভিগেশন বারে +নতুন যোগ করুন বোতামে ক্লিক করুন, তারপর একটি নতুন নথি আপলোড করার বিকল্পটি নির্বাচন করুন।
- আপলোড উইজেটে আপনার মেশিন থেকে লাইসেন্স-এগ্রিমেন্ট.পিডিএফ ডকুমেন্টটি টেনে আনুন, অথবা আপনার ডাউনলোড করা নমুনা নথিগুলির একটি ব্রাউজ করুন এবং নির্বাচন করুন। তারপর, চালিয়ে যেতে পরবর্তী বোতামে ক্লিক করুন।
- ডকুমেন্ট স্কিমার জন্য, আপনি আগে যে স্কিমার তৈরি করেছেন তার নাম নির্বাচন করুন, যেমন ডকুমেন্টস এবং ফর্ম । ডক এআই প্রসেসর আইডির জন্য, আগের ধাপে আপনি কনফিগার করা OCR ডকুমেন্ট প্রসেসর নির্বাচন করুন।
- প্রদর্শন নামের জন্য, আপনি ডিফল্ট নাম (অর্থাৎ ফাইলের নাম) ব্যবহার করতে পারেন, অথবা আপনার নিজস্ব কাস্টম নথির নাম ব্যবহার করতে পারেন।
- আপনার নথি আপলোড এবং প্রক্রিয়া করতে তৈরি বোতামে ক্লিক করুন।
ডকুমেন্ট এআই ওয়ারহাউস কনসোলে ফিরে যান এবং লোন-ফর্ম.পিডিএফ নমুনা নথির সাথে এই ধাপগুলি পুনরাবৃত্তি করুন। আপনি পূর্বে কনফিগার করা form
নথি প্রসেসর নির্বাচন করুন.
ডকুমেন্ট এআই ওয়ারহাউস কনসোলে ফিরে যান এবং ইনভয়েস-sample.pdf নমুনা নথির সাথে এই ধাপগুলি পুনরাবৃত্তি করুন। invoice
ডকুমেন্ট প্রসেসর নির্বাচন করুন যা আপনি আগে কনফিগার করেছেন।
এই পদক্ষেপগুলি সফলভাবে সমাপ্ত করার পরে, আপনি যদি ডকুমেন্ট এআই ওয়্যারহাউস কনসোলে ফিরে যান, তাহলে আপনাকে প্রক্রিয়াকৃত নথিগুলির একটি তালিকা দেখতে হবে যা নিম্নলিখিতগুলির মতো দেখায়:
9. অনুসন্ধান এবং নথি অন্বেষণ
এখন আপনি ডকুমেন্ট এআই ওয়্যারহাউসে একটি নথি আপলোড এবং প্রক্রিয়াকরণ করেছেন, আপনি নথিতে একটি পূর্ণ-পাঠ্য অনুসন্ধান করতে পারেন।
ডকুমেন্ট এআই ওয়ারহাউস কনসোল থেকে, নমুনা নথিতে প্রদর্শিত একটি অনুসন্ধান শব্দ লিখুন যেমন agreement
, তারপর এন্টার কী টিপুন। আপনি আপলোড করা বিভিন্ন নমুনা নথির ফলাফল দেখতে mortgage
এবং monitor
মতো অন্যান্য অনুসন্ধানের অনুসন্ধানগুলি চেষ্টা করতে পারেন৷
ফলাফলগুলিতে, আপনি সেই অনুসন্ধান শব্দটি ধারণ করে এমন সমস্ত নথি দেখতে পাবেন, সাথে অনুসন্ধান শব্দটি হাইলাইট করা নথির পাঠ্যের সারাংশ সহ:
এটি দেখতে একটি নথির নামের উপর ক্লিক করুন.
সনাক্ত করা ক্ষেত্র এবং তাদের সম্পর্কিত ডেটা সহ নথিটি দেখতে AI ভিউ টগলটিতে ক্লিক করুন:
10. অভিনন্দন
আপনি ডকুমেন্ট এআই ওয়্যারহাউস এবং ডকুমেন্ট এআই-তে প্রসেসর ব্যবহার করে ডকুমেন্টে সফলভাবে আপলোড করেছেন, প্রক্রিয়া করেছেন এবং পূর্ণ-পাঠ্য অনুসন্ধান করেছেন। আমরা আপনাকে অন্যান্য নথি নিয়ে পরীক্ষা করতে এবং প্ল্যাটফর্মে উপলব্ধ অন্যান্য প্রসেসরগুলি অন্বেষণ করতে উত্সাহিত করি৷
ক্লিন আপ
এই টিউটোরিয়ালে ব্যবহৃত সংস্থানগুলির জন্য আপনার Google ক্লাউড অ্যাকাউন্টে চার্জ এড়াতে আপনি নিম্নলিখিত পরিষ্কার করতে পারেন:
- ডকুমেন্ট ওয়ারহাউস কনসোল পৃষ্ঠায় নেভিগেট করুন এবং আপনার আপলোড করা সমস্ত নমুনা নথি মুছুন৷
- Google ক্লাউড কনসোলে, ডকুমেন্ট এআই প্রসেসর পৃষ্ঠাতে নেভিগেট করুন এবং আপনার তৈরি করা নমুনা প্রসেসর মুছুন।
- Google ক্লাউড কনসোলে, APIs এবং পরিষেবা পৃষ্ঠাতে নেভিগেট করুন এবং ডকুমেন্ট AI Warehouse API অক্ষম করুন।
আরও জানুন
এই অন্যান্য কোডল্যাবগুলির সাথে ডকুমেন্ট এআই সম্পর্কে শেখা চালিয়ে যান।
- ডকুমেন্ট এআই সহ অপটিক্যাল ক্যারেক্টার রিকগনিশন
- ডকুমেন্ট এআই (পাইথন) সহ ফর্ম পার্সিং
- ডকুমেন্ট এআই (পাইথন) সহ বিশেষায়িত প্রসেসর
- পাইথনের সাথে ডকুমেন্ট এআই প্রসেসর পরিচালনা করা
সম্পদ
লাইসেন্স
এই কাজটি ক্রিয়েটিভ কমন্স অ্যাট্রিবিউশন 2.0 জেনেরিক লাইসেন্সের অধীনে লাইসেন্সপ্রাপ্ত।