تشخیص و ویرایش اشیاء بصری با Gemini و Nano Banana

۱. مرور کلی

در این آزمایشگاه، وظایف زیر را بررسی خواهید کرد:

  • ۱️⃣ تشخیص اشیاء بصری در تصاویر با Gemini
  • ۲️⃣ استخراج و بازیابی اشیاء بصری با نانو موز
  • ۳️⃣ اشیاء بازیابی شده را با Nano Banana ویرایش و تغییر شکل دهید

در اینجا چند نمونه از آنچه به دست خواهید آورد آورده شده است:

1f2cadc1fd825c64.png

آنچه یاد خواهید گرفت

  • نحوه انجام تشخیص اشیاء با واژگان باز با استفاده از درک مکانی Gemini
  • نحوه استخراج کادرهای محدودکننده، زیرنویس‌ها و برچسب‌های پویا با استفاده از زبان طبیعی
  • نحوه ترمیم، تمیز کردن و صاف کردن اشیاء بصری تاب برداشته یا قدیمی
  • نحوه نوشتن سوالات ضروری و توصیفی برای ویرایش تصویر
  • چگونه به طور خلاقانه رنگ‌آمیزی کنیم و تصاویر را به سبک‌های کاملاً جدید تبدیل کنیم
  • چگونه تصاویر را به عکس‌های فیلم‌های لایو اکشن واقع‌گرایانه «سینمایی» کنیم

آنچه نیاز دارید

  • آشنایی با اجرای پایتون در یک نوت‌بوک (در Colab یا هر محیط Jupyter دیگر)
  • یک پروژه Google Cloud (Vertex AI) یا یک کلید API Gemini (Google AI Studio) با قابلیت پرداخت فعال

ℹ️ کل هزینه راه‌اندازی آزمایشگاه از ابتدا تا انتها کمتر از ۲ دلار آمریکا است (۴۵ تصویر هزارتایی تولید شده که هر کدام ۱۲۹۰ توکن دارند).

ed255bd97afbedca.pngf7e616a26c8fa40.pngc0b9ecec49c859f2.pngf7e616a26c8fa40.png8f240cd033d2cc65.png

بیایید شروع کنیم...

۲. قبل از شروع

برای استفاده از API جمینی ، دو گزینه اصلی دارید:

  1. از طریق Vertex AI با یک پروژه Google Cloud
  2. از طریق Google AI Studio با کلید API Gemini

🛠️ گزینه ۱ - رابط برنامه‌نویسی کاربردی Gemini از طریق هوش مصنوعی Vertex

الزامات:

  • یک پروژه ابری گوگل
  • API هوش مصنوعی Vertex باید برای این پروژه فعال باشد.

🛠️ گزینه ۲ - رابط برنامه‌نویسی کاربردی Gemini از طریق استودیوی هوش مصنوعی گوگل

مورد نیاز:

  • یک کلید API جمینی

درباره دریافت کلید API Gemini از Google AI Studio بیشتر بدانید.

۳. نوت‌بوک را اجرا کنید

ابزار مورد نظر خود را برای باز کردن دفترچه یادداشت انتخاب کنید:

🧰 ابزار الف - باز کردن دفترچه یادداشت در Colab

🧰 ابزار B - دفترچه یادداشت را در Colab Enterprise یا Vertex AI Workbench باز کنید

💡 اگر از قبل یک پروژه Google Cloud با نمونه Colab Enterprise یا Vertex AI Workbench پیکربندی کرده‌اید، ممکن است این گزینه ترجیح داده شود.

🧰 ابزار C - دفترچه یادداشت را از گیت‌هاب دریافت کنید و آن را در محیط خودتان اجرا کنید

⚠️ شما باید دفترچه یادداشت را از گیت‌هاب دریافت کنید (یا مخزن را کلون کنید) و آن را در محیط ژوپیتر خود اجرا کنید.

🗺️ فهرست مطالب دفترچه یادداشت

برای پیمایش آسان‌تر، حتماً فهرست مطالب را باز کرده و از آن استفاده کنید. مثال:

de85f5dcc0fe059e.png

🏁 دفترچه یادداشت را اجرا کنید

شما آماده هستید. اکنون می‌توانید دفترچه یادداشت را دنبال و اجرا کنید. از آن لذت ببرید!...

۴. تبریک می‌گویم!

e3299284f68f56f4.png

تبریک می‌گویم که آزمایشگاه کد را تمام کردید!

بیشتر بدانید