1. نظرة عامة
ما هو Document AI Warehouse؟
Document AI Warehouse هي منصّة لتخزين المستندات وبياناتها الوصفية المنظَّمة والبحث فيها وتنظيمها وتحليلها. يمكن أن تتضمن المستندات بيانات منظَّمة مثل النماذج والفواتير، بالإضافة إلى البيانات غير المنظَّمة مثل العقود وأوراق البحث. يمكن استخراج البيانات الوصفية للمستندات تلقائيًا باستخدام معالِجات في Document AI أو إدخالها يدويًا باستخدام الحقول والعلامات.
في هذا الدرس التطبيقي حول الترميز، ستتعلّم كيفية نقل المستندات ومعالجتها والبحث فيها باستخدام واجهة مستخدم Document AI Warehouse. يتم توفير نماذج مستندات PDF لهذا الدرس التطبيقي حول الترميز، بما في ذلك اتفاقية الترخيص ونموذج القرض وفاتورة الطلب.
المتطلبات الأساسية
يعتمد هذا الدرس التطبيقي حول الترميز على المحتوى المقدَّم في الدروس التطبيقية الأخرى حول ترميز المستندات المستنِدة إلى الذكاء الاصطناعي. ننصحك بقراءة المستندات والدروس التطبيقية حول الترميز التالية قبل المتابعة:
- البدء السريع: إعداد واجهة برمجة التطبيقات Document AI API
- معالجة المستندات باستخدام وحدة تحكُّم Google Cloud
- إدارة معالجات الذكاء الاصطناعي للمستندات باستخدام Python
ما ستتعرَّف عليه
- طريقة تفعيل واجهة برمجة التطبيقات Document AI Warehouse API
- طريقة إعداد معالِجات المستندات في Document AI Warehouse
- كيفية تحميل النص وتحليله في أنواع مختلفة من مستندات PDF
- طريقة البحث في المستندات وبياناتها الوصفية في Document AI Warehouse
المتطلبات
2. تنزيل نماذج المستندات
يتم توفير نماذج مستندات PDF لهذا الدرس التطبيقي حول الترميز، بما في ذلك اتفاقية الترخيص ونموذج القرض وفاتورة الطلب. يمكنك تنزيل نماذج المستندات التالية لاستخدامها في هذا الدرس التطبيقي حول الترميز.
بدلاً من ذلك، يمكنك تنزيل نماذج المستندات من حزمة Google Cloud Storage العامة باستخدام gsutil
.
gsutil cp gs://cloud-samples-data/documentai/codelabs/warehouse/license-agreement.pdf .
gsutil cp gs://cloud-samples-data/documentai/codelabs/warehouse/loan-form.pdf .
gsutil cp gs://cloud-samples-data/documentai/codelabs/warehouse/order-invoice.pdf .
في خطوة لاحقة، ستقوم بتحميل نماذج المستندات هذه، وتحليلها باستخدام معالجات مستندات مختلفة، وتخزين المستندات والبيانات الوصفية الناتجة في Document AI Warehouse.
3- تفعيل واجهة برمجة التطبيقات Document AI Warehouse API
قبل أن تتمكّن من البدء في استخدام Document AI Warehouse، يجب تفعيل واجهة برمجة التطبيقات.
استخدام Cloud Console
- افتح وحدة تحكُّم Google Cloud في متصفّحك.
- في Google Cloud Console، انتقِل إلى مكتبة واجهة برمجة التطبيقات لتصفّح واجهات برمجة التطبيقات والخدمات التي يمكن تفعيلها.
- باستخدام شريط البحث أعلى صفحة "مكتبة واجهة برمجة التطبيقات"، ابحث عن
Document AI Warehouse
، ثم انقر على الخدمة الناتجة. - انقر على الزر تفعيل لتفعيل واجهة برمجة التطبيقات Document AI Warehouse API في مشروعك على Google Cloud.
البديل: استخدام gcloud CLI
بدلاً من ذلك، يمكن تفعيل واجهة برمجة التطبيقات باستخدام الأمر gcloud
التالي:
gcloud services enable contentwarehouse.googleapis.com
إذا تم تفعيل واجهة برمجة التطبيقات بنجاح، من المفترض أن تظهر لك رسالة مشابهة لما يلي:
Operation "operations/..." finished successfully.
أنت الآن جاهز لاستخدام Document AI Warehouse.
4. عرض وحدة تحكّم Document AI Warehouse
في المتصفّح، انتقِل إلى وحدة تحكّم Document AI Warehouse على الرابط https://documentwarehouse.cloud.google.com (الخارجية عن "وحدة تحكُّم Google Cloud"). ستستخدم وحدة تحكّم Document AI Warehouse مع مشروعك على Google Cloud لتنفيذ الخطوات المتبقية في هذا الدرس التطبيقي حول الترميز لتحميل المستندات ومعالجتها والبحث فيها.
إذا كانت هذه هي المرة الأولى التي تستخدم فيها Document AI Warehouse، يُرجى الاطّلاع على مستندات Document AI Warehouse للحصول على مزيد من المعلومات عن ضبط مشروعك وإعداداتك وفقًا لاحتياجاتك.
5- إنشاء مخطط مستند
تحدِّد مخططات المستندات نوع المستند والحقول التي تخزّنها في Document AI Warehouse. وعليك إنشاء مخطط قبل تحميل أي مستندات جديدة.
- من وحدة تحكّم Document AI Warehouse، انقر على الزرّ المشرف في أعلى يسار الصفحة.
- انقر على عنصر المخطط في شريط التنقل الأيمن، ثم انقر على الزر + إضافة جديد.
- أدخِل اسمًا لمخططك، مثل
Documents and Forms
، وتأكَّد من اختيار مستند باعتباره نوع المخطط. بعد ذلك، انقر على الزر التالي للمتابعة. - ويمكنك ترك تعريف مخطط JSON التلقائي كما هو، على أن يظهر على النحو التالي:
{ "display_name": "Documents and Forms", "property_definitions": [], "document_is_folder": false, "description": "" }
- بعد ذلك، انقر على الزر تمّ للانتهاء من إنشاء مخطط المستند.
عند الانتهاء من هذه الخطوات بنجاح، من المفترض أن تظهر لك رسالة تفيد بأن مخطط المستند قد تم إنشاؤه. يمكنك النقر على الزر عرض مخطط المستند، ثم على علامة التبويب JSON لتأكيد المخطط، الذي يجب أن يظهر بشكل مشابه لما يلي:
6- إنشاء برامج معالجة المستندات
في هذه الخطوة، ستُنشئ معالِجات مستندات يمكنك استخدامها لإجراء بحث كامل في أنواع مختلفة من المستندات في Document AI Warehouse.
- في Google Cloud Console، انتقِل إلى صفحة "نظرة عامة" ضمن Document AI Platform.
- انقر على استكشاف المعالجات، ثم اختَر التعرّف البصري على الأحرف (OCR) للمستندات كنوع معالج البيانات الذي تريد إنشائه.
- حدِّد اسمًا لمعالجة المستندات مثل
ocr
ومنطقتك المفضّلة، ثم انقر على إنشاء لإنشاء المعالج. - في صفحة تفاصيل معالج البيانات، انسخ رقم تعريف معالج البيانات الذي سنستخدمه لاحقًا لإعداد معالج في Document AI Warehouse.
كرِّر هذه الخطوات واختَر المحلل اللغوي للنموذج كنوع معالج المستندات لإنشاء form
وتحديده كاسم المعالج.
كرِّر هذه الخطوات واختَر المحلل اللغوي للفواتير كنوع معالج المستندات لإنشاء invoice
وتحديده كاسم المعالج.
عند إكمال هذه الخطوات بنجاح، من المفترض أن تظهر لك قائمة بمعالجات المستندات التي تبدو مشابهة لما يلي:
7. إعداد برامج معالجة المستندات
في هذه الخطوة، سيتم إعداد معالِجات المستندات في Document AI Warehouse من خلال الرجوع إلى المعالِجات التي أنشأتها في الخطوة السابقة.
- من وحدة تحكّم Document AI Warehouse، انقر على الزرّ المشرف في شريط الأدوات العلوي.
- انقر على العنصر معالِجات الذكاء الاصطناعي في المستند في شريط التنقّل الأيمن، ثم انقر على الزر + إضافة عنصر جديد.
- انقر على الزر + إضافة معالج جديد، ثم حدِّد اسمًا ورقم تعريف معالج بيانات من الخطوة السابقة.
- انقر على الزر حفظ لحفظ التغييرات.
كرِّر هذه الخطوات لإضافة المعالجَين الآخرَين إلى إعدادات Document AI Warehouse باستخدام الزرّ + إضافة معالج جديد، بما في ذلك المحلِّل اللغوي للنماذج والمحلل اللغوي للفواتير. تأكد من إضافة معالجين إضافيين ضمن معرّف مخطط المستند نفسه باستخدام الزر + إضافة معالج جديد، بدلاً من إضافة مخطط آخر باستخدام الزر + إضافة جديد.
عند إكمال هذه الخطوات بنجاح، من المفترض أن تظهر لك قائمة بمعالجات المستندات التي تم ضبطها والتي تبدو مشابهة لما يلي:
8. تحميل نماذج المستندات ومعالجتها
الآن بعد تحديد مخطط وإعداد معالِجات لمستنداتك، يمكنك تحميل المستندات إلى Document AI Warehouse.
- ارجع إلى وحدة تحكّم Document AI Warehouse وانقر على الزرّ +إضافة جديد في شريط التنقّل الأيمن، ثم حدِّد الخيار تحميل مستند جديد.
- اسحب المستند license-agreement.pdf من جهازك إلى أداة التحميل، أو تصفَّح نماذج المستندات التي نزّلتها واختَرها. بعد ذلك، انقر على زر التالي للمتابعة.
- بالنسبة إلى مخطط المستند، اختَر اسم المخطط الذي أنشأته سابقًا، مثل المستندات والنماذج. بالنسبة إلى معرّف معالج مستند الذكاء الاصطناعي (Doc AI)، اختَر معالج مستندات التعرّف البصري على الأحرف الذي تم ضبطه في الخطوة السابقة.
- بالنسبة إلى الاسم المعروض، يمكنك استخدام الاسم التلقائي (أي اسم الملف) أو استخدام اسم المستند المخصّص.
- انقر على الزر إنشاء لتحميل المستند ومعالجته.
ارجع إلى وحدة تحكّم Document AI Warehouse وكرِّر هذه الخطوات مع نموذج المستند loan-form.pdf. اختَر معالج المستندات form
الذي ضبطته سابقًا.
ارجع إلى وحدة تحكّم Document AI Warehouse وكرِّر هذه الخطوات مع نموذج المستند invoice- sample.pdf. اختَر معالج المستندات invoice
الذي ضبطته سابقًا.
بعد إكمال هذه الخطوات بنجاح، إذا عدت إلى وحدة تحكم Document AI Warehouse، فيُفترض أن تظهر لك قائمة بالمستندات التي تمت معالجتها والتي تبدو مشابهة لما يلي:
9. البحث في المستندات واستكشافها
الآن بعد أن حمّلت مستندًا وعالجته في Document AI Warehouse، يمكنك إجراء بحث في النص الكامل في المستندات.
من وحدة تحكّم Document AI Warehouse، أدخِل عبارة البحث التي تظهر في نماذج المستندات مثل agreement
، ثم اضغط على مفتاح Enter. يمكنك تجربة طلبات بحث أخرى مثل mortgage
وmonitor
للاطّلاع على نتائج لنماذج المستندات المختلفة التي حمّلتها.
في النتائج، سترى جميع المستندات التي تحتوي على عبارة البحث هذه، بالإضافة إلى ملخص لنص المستند مع تمييز عبارة البحث:
انقر على اسم مستند لعرضه.
انقر على مفتاح التبديل عرض الذكاء الاصطناعي (AI) للاطّلاع على المستند مع الحقول التي تم رصدها والبيانات المرتبطة بها:
10. تهانينا
لقد تمكّنت من تحميل المستندات ومعالجتها وإجراء بحث كامل عنها باستخدام Document AI Warehouse وباستخدام معالِجات في Document AI. ننصحك بتجربة مستندات أخرى واستكشاف المعالِجات الأخرى المتاحة على المنصّة.
تنظيف
يمكنك إجراء الإزالة التالية لتجنُّب تحمُّل الرسوم المفروضة على حسابك على Google Cloud مقابل الموارد المستخدَمة في هذا البرنامج التعليمي:
- انتقل إلى صفحة وحدة تحكم مستودع المستندات واحذف جميع نماذج المستندات التي حمّلتها.
- في Google Cloud Console، انتقِل إلى صفحة معالِجات الذكاء الاصطناعي للمستندات واحذف نماذج معالجات النماذج التي أنشأتها.
- في وحدة التحكّم في Google Cloud، انتقِل إلى صفحة واجهات برمجة التطبيقات والخدمات وأوقِف واجهة برمجة التطبيقات Document AI Warehouse.
مزيد من المعلومات
تابِع تعلُّم المزيد عن Document AI من خلال هذه الدروس التطبيقية الأخرى حول الترميز.
- التعرّف البصري على الأحرف باستخدام الذكاء الاصطناعي للمستندات
- تحليل النماذج باستخدام الذكاء الاصطناعي للمستندات (Python)
- معالجات متخصّصة تستخدم الذكاء الاصطناعي للمستندات (Python)
- إدارة معالجات الذكاء الاصطناعي للمستندات باستخدام Python
الموارد
- مستندات معرض الذكاء الاصطناعي للمستندات
- مستقبل المستندات - قائمة تشغيل على YouTube
- مستودع نماذج الذكاء الاصطناعي (AI) للمستندات
الترخيص
هذا العمل مرخّص بموجب رخصة المشاع الإبداعي 2.0 مع نسب العمل إلى مؤلف عام.