BigQuery UI Navigation and Data Exploration Codelab

۱. مقدمه

بیگ‌کوئری یک انبار داده بدون سرور، بسیار مقیاس‌پذیر و مقرون‌به‌صرفه است. کافیست داده‌های خود را به بیگ‌کوئری منتقل کنید و اجازه دهید ما کارهای سخت را انجام دهیم تا بتوانید روی آنچه واقعاً مهم است، یعنی اداره کسب و کار خود، تمرکز کنید. می‌توانید دسترسی به پروژه و داده‌های خود را بر اساس نیازهای کسب و کارتان کنترل کنید، مانند اینکه به دیگران امکان مشاهده یا پرس‌وجو از داده‌های خود را بدهید.

در این آزمایشگاه، شما با امکانات تحلیلی BigQuery آشنا خواهید شد. یاد خواهید گرفت که چگونه یک مجموعه داده را از یک مخزن ذخیره‌سازی ابری گوگل وارد کنید و با کار با یک مجموعه داده بانکداری خرد، با رابط کاربری BigQuery آشنا شوید. علاوه بر این، این آزمایشگاه به شما یاد می‌دهد که چگونه ویژگی‌های کلیدی BigQuery را کشف کنید که تجزیه و تحلیل روزانه شما را بسیار آسان‌تر می‌کند، مانند خروجی گرفتن نتایج پرس‌وجو در یک صفحه گسترده، مشاهده و اجرای پرس‌وجوها از تاریخچه پرس‌وجو، مشاهده عملکرد پرس‌وجو و ایجاد نماهای جدول برای استفاده توسط سایر تیم‌ها و بخش‌ها.

آنچه یاد خواهید گرفت

در این آزمایشگاه، شما یاد می‌گیرید که چگونه وظایف زیر را انجام دهید:

  • بارگذاری داده‌های جدید در BigQuery
  • با رابط کاربری BigQuery آشنا شوید
  • اجرای کوئری‌ها در BigQuery
  • مشاهده عملکرد پرس و جو
  • ایجاد نماها در BigQuery
  • به اشتراک گذاری ایمن مجموعه داده‌ها با دیگران

۲. مقدمه: درک رابط کاربری BigQuery

در این بخش یاد خواهید گرفت که چگونه در رابط کاربری BigQuery پیمایش کنید، مجموعه داده‌های موجود را مشاهده کنید و یک کوئری ساده اجرا کنید.

بارگیری رابط کاربری BQ

  1. عبارت "BigQuery" را که در بالای کنسول پلتفرم ابری گوگل قرار دارد، تایپ کنید.
  2. از لیست گزینه‌ها، BigQuery را انتخاب کنید. حتماً گزینه‌ای را انتخاب کنید که لوگوی BigQuery، یعنی ذره‌بین، را داشته باشد.

مشاهده مجموعه داده‌ها و اجرای کوئری‌ها

ee95ce13969ee1ad.png

  1. در پنل سمت چپ در بخش منابع (Resource)، روی پروژه BigQuery خود کلیک کنید.
  2. برای مشاهده جداول موجود در آن مجموعه داده، روی bq_demo کلیک کنید.
  3. در کادر جستجو، عبارت «card» را تایپ کنید تا فهرستی از جداول و مجموعه داده‌هایی که در نامشان کلمه «card» وجود دارد را مشاهده کنید.
  4. جدول "card_transactions" را از لیست نتایج جستجو انتخاب کنید

beb6ff6ca2930125.png

  1. برای مشاهده‌ی متادیتای این جدول، روی تب جزئیات (Details) در زیر بخش card_transactions کلیک کنید.
  2. برای دیدن پیش‌نمایش جدول، روی برگه پیش‌نمایش کلیک کنید

[ نکته رقابتی]: ادغام با کاتالوگ داده‌های گوگل به این معنی است که ابرداده‌های BigQuery می‌توانند به همراه سایر منابع داده، مانند دریاچه‌های داده یا منابع داده عملیاتی، مدیریت شوند. این یکی از نمونه‌هایی است که نشان می‌دهد Google Cloud فقط یک انبار داده رابطه‌ای نیست، بلکه یک پلتفرم کامل داده‌های تحلیلی است.

  1. برای پرس‌وجو در جدول "card_transactions" روی نماد ذره‌بین کلیک کنید. یک متن خودکار تولید شده، ویرایشگر پرس‌وجوی BigQuery را پر می‌کند.
  2. کد زیر را وارد کنید تا فروشندگان متمایز از جدول Card_Transactions را به ما نشان دهد.
SELECT distinct (merchant) FROM bq_demo.card_transactions LIMIT 1000
  1. برای اجرای پرس و جو، روی دکمه اجرا کلیک کنید.

۳۵۱۱۳۵۴۲e7ec6fa6.png

۳. ایجاد مجموعه داده‌ها و اشتراک‌گذاری نماها

اشتراک‌گذاری داده‌ها و مدیریت آنها بسیار مهم است، این کار را می‌توان به صورت شهودی در رابط کاربری BQ انجام داد. در این بخش یاد خواهید گرفت که چگونه یک مجموعه داده جدید ایجاد کنید، آن را با یک نما پر کنید و آن مجموعه داده را به اشتراک بگذارید.

مشاهده تاریخچه پرس و جو

  1. روی «سابقه جستجو» در پنل سمت چپ کنسول GCP کلیک کنید
  2. روی refresh در پنل Query History کلیک کنید.
  3. برای مشاهده نتایج جستجو، روی تصویر/فلش دانلود در سمت راست جستجو کلیک کنید.

6e3232ed96f647b8.png

ایجاد یک مجموعه داده جدید

  1. [نام پروژه خود] را در قسمت منابع رابط کاربری BigQuery انتخاب کنید.
  2. از پنجره اطلاعات پروژه، گزینه «ایجاد مجموعه داده جدید» را انتخاب کنید.
  3. برای شناسه مجموعه داده:

bq_demo_shared

  1. تمام فیلدهای دیگر را به صورت پیش‌فرض رها کنید
  2. روی «ایجاد مجموعه داده» کلیک کنید

b433eba38f55124f.pngdd774aca416e7fbc.png

ایجاد نماها

[ نکته رقابتی]: BigQuery کاملاً با ANSI SQL سازگار است و از اتصالات چند جدولی ساده و پیچیده و توابع تحلیلی غنی پشتیبانی می‌کند. ما به طور مداوم پشتیبانی پیشرفته‌ای را برای انواع داده و توابع رایج SQL که در انبارهای داده سنتی استفاده می‌شوند، منتشر کرده‌ایم تا روند مهاجرت را آسان‌تر کنیم.

  1. در بالای پنجره ویرایشگر پرس‌وجو، گزینه «ایجاد پرس‌وجوی جدید» را انتخاب کنید.
  2. کد زیر را در ویرایشگر کوئری وارد کنید
WITH revenue_by_month AS (
SELECT
    card.type AS card_type,
    FORMAT_DATE('%Y-%m', trans_date) as revenue_date,
    SUM(amount) as revenue
FROM bq_demo.card_transactions
JOIN bq_demo.card ON card_transactions.cc_number = card.card_number
WHERE trans_date  DATE_ADD(CURRENT_DATE, INTERVAL -1 YEAR)
GROUP BY card_type, revenue_date
)
SELECT
    card_type,
    revenue_date,
    revenue as monthly_rev,
    revenue -  LAG(revenue) OVER (ORDER BY card_type, revenue_date ASC) as rev_change
FROM revenue_by_month
ORDER BY card_type, revenue_date ASC;
  1. روی «ذخیره نمایش» کلیک کنید
  2. پروژه فعلی خود را برای نام پروژه انتخاب کنید
  3. مجموعه داده تازه ایجاد شده را انتخاب کنید:

bq_demo_shared

  1. برای نام جدول:

تغییر_بر_حسب_نوع_کارت

  1. روی ذخیره کلیک کنید.

4b111056b544c27d.png

اشتراک‌گذاری نماها و مجموعه داده‌ها

  1. مجموعه داده "bq_demo_shared" را از پنل منابع سمت چپ در رابط کاربری BigQuery انتخاب کنید.
  2. روی «اشتراک‌گذاری مجموعه داده» از قسمت اطلاعات مجموعه داده کلیک کنید.
  3. یک آدرس ایمیل وارد کنید
  4. از منوی کشویی نقش، گزینه «نمایشگر داده‌های BigQuery» را انتخاب کنید.
  5. روی «افزودن» کلیک کنید
  6. کلیک کنید انجام شد

۱c04b6b5ebc191dc.png

کاوش داده‌ها در برگه‌ها

[ نکته رقابتی]: یکی دیگر از مزایای BigQuery در مقایسه با رقبایش، موتور BI است. موتور BI می‌تواند برای ایجاد خلاصه‌ای از نوع BI در کمتر از یک ثانیه از طریق موتور ذخیره‌سازی درون حافظه‌ای استفاده شود. این قابلیت در حال حاضر توسط Google Data Studio پشتیبانی می‌شود، اما به زودی برای تسریع همه پرس‌وجوها در BigQuery در دسترس خواهد بود.

برای مثال:

اسنوفلیک برای داشبوردها و مصورسازی داده‌ها به ابزارهای هوش تجاری شخص ثالث متکی است، در حالی که جی‌سی‌پی طیف وسیعی از ابزارهای هوش تجاری یکپارچه، از جمله Connected Sheets، Data Studio و Looker را ارائه می‌دهد.

  1. نمای "rev_change_by_card_type" را از پنل منابع سمت چپ در رابط کاربری BigQuery انتخاب کنید.
  2. برای مشاهده، روی ذره‌بین کلیک کنید ۲۵۵be22b0eaf339.png
  3. نوع:

انتخاب *

از bq_demo_shared.rev_change_by_card_type

  1. روی اجرا کلیک کنید
  2. روی نماد «صادرات» از پنل نتایج کلیک کنید
  3. «کاوش داده‌ها با برگه‌ها» را انتخاب کنید

۹۶۱۷b۵۲۲۰۲۵fd۳۳۷.png

  1. روی «شروع تحلیل» کلیک کنید
  2. انتخاب "جدول محوری"
  3. انتخاب «برگه جدید»
  4. روی «ایجاد» کلیک کنید
  5. عبارت "revenue_date" را در بخش Row از Pivot Table Editor که در سمت راست پنجره Sheets قرار دارد، اضافه کنید.
  6. عبارت "card_type" را در بخش ستون‌های ویرایشگر جدول محوری اضافه کنید.
  7. عبارت "monthly_rev" را در بخش ستون‌های ویرایشگر جدول محوری اضافه کنید.
  8. روی اعمال کلیک کنید

48e67c2e04965796.png

  1. به بالای صفحه رابط کاربری Sheets بروید و گزینه Insert Chart را انتخاب کنید.

۴. راه‌اندازی: یکپارچه‌سازی داده‌ها

در این بخش یاد خواهید گرفت که چگونه یک جدول جدید ایجاد کنید و روی یکی از مجموعه داده‌های عمومی موجود در Google Cloud، عملیات JOINS را انجام دهید.

[نکته رقابتی]:

بیگ‌کوئری سال‌هاست که از مجموعه داده‌های مشترک پشتیبانی می‌کند. مشتریان در هر پروژه‌ای می‌توانند هم از مجموعه داده‌های عمومی و هم از مجموعه داده‌های موجود در پروژه‌های دیگری که با آنها به اشتراک گذاشته شده است، پرس‌وجو کنند.

BigQuery می‌تواند از طریق استفاده از جداول خارجی، از دریاچه‌های داده در GCS پشتیبانی کند. علاوه بر بارگذاری انبوه، BigQuery از قابلیت پخش جریانی داده‌ها به پایگاه داده با سرعتی بالغ بر صدها مگابایت در ثانیه پشتیبانی می‌کند. Snowflake از پخش جریانی داده‌ها پشتیبانی نمی‌کند.

وارد کردن داده‌ها به یک جدول جدید

  1. در قسمت منابع، مجموعه داده bq_demo را انتخاب کنید.
  2. در قسمت اطلاعات مجموعه داده، گزینه «ایجاد جدول» را انتخاب کنید.
  3. برای منبع، فضای ذخیره‌سازی ابری گوگل را انتخاب کنید
  4. در کادر متن مسیر فایل:

gs://retail-banking-looker/district

  1. CSV را برای قالب فایل انتخاب کنید
  2. برای نام جدول، "منطقه" را وارد کنید
  3. کادر انتخاب مربوط به طرحواره تشخیص خودکار را علامت بزنید
  4. روی ایجاد جدول کلیک کنید

پرس‌وجو از مجموعه داده‌های عمومی

  1. در ویرایشگر پرس‌وجو، پرس‌وجوی زیر را وارد کنید:
SELECT
    CAST(geo_id as STRING) AS zip_code,
    total_pop,
    median_age,
    households,
    income_per_capita,
    housing_units,
    vacant_housing_units_for_sale,
    ROUND(SAFE_DIVIDE(employed_pop, pop_16_over),4) AS rate_employment,
    ROUND(SAFE_DIVIDE(bachelors_degree_or_higher_25_64, pop_25_64),4) AS rate_bachelors_degree_or_higher_25_64
  FROM
    `bigquery-public-data.census_bureau_acs.zip_codes_2017_5yr`;
  1. روی اجرا کلیک کنید
  2. مشاهده نتایج

dff40709db70d75.png

  1. حالا این داده‌های عمومی را با یک کوئری دیگر ترکیب می‌کنیم. کد SQL زیر را در ویرایشگر کوئری وارد کنید:
WITH customer_counts AS (
    select regexp_extract(address, "[0-9][0-9][0-9][0-9][0-9]") as zip_code, 
    count(*) as num_clients
    FROM bq_demo.client
    GROUP BY zip_code
    )
SELECT 
    CAST(geo_id as STRING) AS zip_code,
    total_pop,
    median_age,
    households,
    income_per_capita,
    ROUND(SAFE_DIVIDE(employed_pop, pop_16_over),4) AS rate_employment,
    num_clients
FROM
    `bigquery-public-data.census_bureau_acs.zip_codes_2017_5yr`
JOIN customer_counts on zip_code = geo_id
ORDER BY num_clients DESC
  1. روی اجرا کلیک کنید
  2. مشاهده نتایج

b853ad571e7a3038.png

۵. مدیریت ظرفیت

کار با اسلات‌ها و رزروها

BQ مدل‌های قیمت‌گذاری متعددی را برای برآورده کردن نیازهای شما ارائه می‌دهد. اکثر مشتریان بزرگ در درجه اول از نرخ ثابت برای قیمت‌گذاری قابل پیش‌بینی با ظرفیت رزرو شده استفاده می‌کنند. برای افزایش ظرفیت فراتر از آن ظرفیت پایه، BQ اسلات‌های انعطاف‌پذیر را ارائه می‌دهد که به شما امکان می‌دهد در لحظه به ظرفیت اضافی برسید و سپس به طور خودکار و بدون هیچ تأثیری بر اجرای پرس‌وجوها، ظرفیت را کاهش دهید. BQ همچنین دارای یک مدل اسکن بایت است که به شما امکان می‌دهد فقط برای پرس‌وجوهایی که اجرا می‌کنید هزینه بپردازید.

[ نکته رقابتی: برخی از رقبا منحصراً بر روی یک مدل ظرفیت ثابت کار می‌کنند که در آن مشتریان باید برای هر بار کاری در سازمان خود یک انبار مجازی اختصاص دهند. علاوه بر یک مدل کم‌هزینه برای هر پرس‌وجو که شروع به کار با BigQuery را آسان می‌کند، ما از یک مدل قیمت‌گذاری ظرفیت با نرخ ثابت پشتیبانی می‌کنیم که در آن ظرفیت بیکار می‌تواند بین مجموعه‌ای از بارهای کاری به اشتراک گذاشته شود. ]

  1. به برگه رزروها بروید.

۹۶۴f4ab78d35d067.png

  1. روی «خرید اسلات» کلیک کنید

c8cb5ee61bbea814.png

  1. به عنوان مدت زمان، "Flex" را انتخاب کنید.
  2. ۵۰۰ جایگاه انتخاب کنید.
  3. خرید را تأیید کنید.

d615f5908dffc1ee.png

  1. روی مشاهده تعهدات اسلات کلیک کنید.
  2. روی «ایجاد رزرو» کلیک کنید
  3. کاربر "دمو" به عنوان نام رزرو
  4. ایالات متحده را به عنوان مکان انتخاب کنید
  5. برای اسلات‌ها عدد ۵۰۰ را تایپ کنید (همه اسلات‌ها موجود است)
  6. تکالیف کلیک کنید
  7. انتخاب پروژه فعلی برای پروژه سازمانی
  8. برای شناسه رزرو، گزینه «دمو» را انتخاب کنید
  9. روی ایجاد کلیک کنید."