1. Pengantar
BigQuery adalah data warehouse serverless, sangat skalabel, dan hemat biaya. Cukup pindahkan data Anda ke BigQuery dan biarkan kami yang menangani sisanya sehingga Anda dapat berfokus pada hal yang benar-benar penting, yaitu menjalankan bisnis Anda. Anda dapat mengontrol akses baik ke project maupun data Anda berdasarkan kebutuhan bisnis, seperti mengizinkan orang lain melihat atau mengkueri data Anda.
Di lab ini, Anda akan menemukan kemungkinan analisis BigQuery. Anda akan mempelajari cara mengimpor set data dari bucket Google Cloud Storage dan memahami UI BigQuery dengan menggunakan set data Retail banking. Selain itu, lab ini akan mengajarkan cara menemukan fitur utama di BigQuery yang mempermudah analisis sehari-hari Anda, seperti mengekspor hasil kueri dalam spreadsheet, melihat dan menjalankan kueri dari histori kueri, melihat performa kueri, dan membuat tampilan tabel untuk digunakan oleh tim dan departemen lain.
Yang akan Anda pelajari
Di lab ini, Anda akan mempelajari cara melakukan tugas berikut:
- Memuat data baru ke BigQuery
- Mengenal UI BigQuery
- Menjalankan Kueri di BigQuery
- Melihat Performa Kueri
- Membuat Tampilan di BigQuery
- Membagikan set data kepada orang lain dengan aman
2. Pengantar: Memahami UI BigQuery
Di bagian ini, Anda akan mempelajari cara menjelajahi UI BigQuery, melihat set data yang tersedia, dan menjalankan kueri sederhana.
Memuat UI BQ
- Ketik "BigQuery" di bagian atas Konsol Google Cloud Platform.
- Pilih BigQuery dari daftar opsi. Pastikan untuk memilih opsi yang memiliki logo BigQuery, yaitu kaca pembesar.
Melihat Set Data dan Menjalankan Kueri

- Di panel kiri pada bagian Resource, klik project BigQuery Anda.
- Klik
bq_demountuk melihat tabel dalam set data tersebut - Di kotak penelusuran, ketik "kartu" untuk melihat daftar tabel dan set data yang berisi "kartu" dalam namanya.
- Pilih tabel "card_transactions" dari daftar hasil penelusuran

- Klik tab Detail di panel
card_transactionsuntuk melihat metadata tabel ini. - Klik tab Preview untuk melihat pratinjau tabel
[Competitive Talking Point]: Integrasi dengan Google Data Catalog berarti metadata BigQuery dapat dikelola bersama dengan sumber data lain, seperti data lake atau sumber data operasional. Ini adalah salah satu contoh yang menunjukkan bahwa Google Cloud bukan hanya data warehouse relasional, tetapi merupakan platform Data Analisis secara keseluruhan.
- Klik ikon kaca pembesar untuk membuat kueri tabel "card_transactions". Teks yang dibuat otomatis akan mengisi editor kueri BigQuery.
- Masukkan kode di bawah untuk menunjukkan kepada kami penjual yang berbeda dari tabel Card_Transactions
SELECT distinct (merchant) FROM bq_demo.card_transactions LIMIT 1000
- Klik tombol Run untuk menjalankan kueri.

3. Membuat set data dan membagikan tampilan
Berbagi data dan tata kelola sangat penting, hal ini dapat dilakukan secara intuitif di UI BQ. Di bagian ini, Anda akan mempelajari cara membuat set data baru, mengisinya dengan tampilan, dan membagikan set data tersebut.
Melihat Histori Kueri
- Klik "Histori Kueri" di panel kiri GCP Console
- Klik muat ulang di panel Histori Kueri
- Klik panah/download gambar di paling kanan kueri untuk melihat hasil kueri.

Membuat set data baru
- Pilih [nama project Anda] di panel resource UI BigQuery.
- Pilih "Buat Set Data baru" dari panel informasi project
- Untuk ID Set Data:
bq_demo_shared
- Biarkan semua kolom lain tetap pada nilai defaultnya
- Klik "Buat Set Data"

Membuat Tampilan
[Competitive Talking Point]: BigQuery sepenuhnya kompatibel dengan ANSI SQL dan mendukung gabungan multi-tabel sederhana dan kompleks serta fungsi analitik yang canggih. Kami terus merilis dukungan yang ditingkatkan untuk jenis dan fungsi data SQL umum yang digunakan di data warehouse tradisional untuk mempermudah proses migrasi.
- Pilih "Compose New Query" di bagian atas panel Query Editor.
- Masukkan kode berikut di editor kueri
WITH revenue_by_month AS (
SELECT
card.type AS card_type,
FORMAT_DATE('%Y-%m', trans_date) as revenue_date,
SUM(amount) as revenue
FROM bq_demo.card_transactions
JOIN bq_demo.card ON card_transactions.cc_number = card.card_number
WHERE trans_date DATE_ADD(CURRENT_DATE, INTERVAL -1 YEAR)
GROUP BY card_type, revenue_date
)
SELECT
card_type,
revenue_date,
revenue as monthly_rev,
revenue - LAG(revenue) OVER (ORDER BY card_type, revenue_date ASC) as rev_change
FROM revenue_by_month
ORDER BY card_type, revenue_date ASC;
- Klik "Simpan Tampilan"
- Pilih project Anda saat ini untuk Nama Project
- Pilih Set Data yang baru dibuat:
bq_demo_shared
- Untuk Nama Tabel:
rev_change_by_card_type
- Klik Simpan.

Membagikan Tampilan dan Set Data
- Pilih set data "bq_demo_shared" dari panel resource kiri di UI BigQuery.
- Klik "Bagikan Set Data" dari panel informasi set data
- Masukkan alamat email
- Pilih "BigQuery Data Viewer" dari menu dropdown Peran
- Klik "Tambahkan"
- Klik Selesai

Menjelajahi Data di Spreadsheet
[Competitive Talking Point]: Manfaat lain dari BigQuery dibandingkan dengan pesaingnya adalah BI Engine. BI Engine dapat digunakan untuk membuat kueri ringkasan jenis BI ditampilkan dalam waktu kurang dari satu detik melalui mesin caching dalam memori. Saat ini, fitur ini didukung oleh Google Data Studio, tetapi akan segera tersedia untuk mempercepat semua kueri di BigQuery.
Contoh:
Snowflake mengandalkan alat BI pihak ketiga untuk dasbor dan visualisasi data, sementara GCP menawarkan berbagai alat BI terintegrasi, termasuk Sheet yang Terhubung, Data Studio, dan Looker.
- Pilih tampilan "rev_change_by_card_type" dari panel resource kiri di UI BigQuery.
- Klik kaca pembesar untuk membuat kueri tampilan

- Jenis:
SELECT *
FROM bq_demo_shared.rev_change_by_card_type
- Klik Run
- Klik Ikon "Ekspor" dari Panel Hasil
- Pilih "Jelajahi Data dengan Spreadsheet"

- Klik"Mulai Analisis"
- Pilih "Pivot Table"
- Pilih "Spreadsheet Baru"
- Klik "Buat"
- Tambahkan "revenue_date" di bagian Baris pada Editor Tabel Pivot yang ada di sebelah kanan jendela Spreadsheet
- Tambahkan "card_type" di bagian Kolom pada Editor Tabel Pivot
- Tambahkan "monthly_rev" di bagian Kolom pada Editor Tabel Pivot
- Klik Terapkan

- Buka robbin atas UI Spreadsheet dan pilih Sisipkan Diagram
4. Penyiapan: Integrasi Data
Di bagian ini, Anda akan mempelajari cara membuat tabel baru dan melakukan JOINS pada salah satu dari banyak set data publik yang tersedia di Google Cloud.
[Competitive Talking Point]:
BigQuery telah mendukung set data bersama selama bertahun-tahun. Pelanggan di project mana pun dapat membuat kueri set data publik dan set data di project lain yang telah dibagikan kepada mereka.
BigQuery dapat mendukung data lake di GCS melalui penggunaan tabel eksternal. Selain pemuatan massal, BigQuery mendukung kemampuan untuk melakukan streaming data ke dalam database dengan kecepatan lebih dari ratusan MB per detik. Snowflake tidak mendukung streaming data.
Mengimpor Data ke tabel baru
- Di panel resource, pilih set data bq_demo
- Di panel informasi set data, pilih "Buat Tabel"
- Pilih Google Cloud Storage untuk Sumber
- Di kotak teks jalur file:
gs://retail-banking-looker/district
- Pilih CSV untuk Format File
- Masukkan "district" untuk Nama Tabel
- Centang kotak untuk skema Deteksi Otomatis
- Klik Buat Tabel
Membuat Kueri Set Data Publik
- Di editor kueri, masukkan kueri berikut:
SELECT
CAST(geo_id as STRING) AS zip_code,
total_pop,
median_age,
households,
income_per_capita,
housing_units,
vacant_housing_units_for_sale,
ROUND(SAFE_DIVIDE(employed_pop, pop_16_over),4) AS rate_employment,
ROUND(SAFE_DIVIDE(bachelors_degree_or_higher_25_64, pop_25_64),4) AS rate_bachelors_degree_or_higher_25_64
FROM
`bigquery-public-data.census_bureau_acs.zip_codes_2017_5yr`;
- Klik Run
- Lihat Hasilnya

- Sekarang kita akan menggabungkan data publik ini dengan kueri lain. Masukkan Kode SQL berikut di Query Editor:
WITH customer_counts AS (
select regexp_extract(address, "[0-9][0-9][0-9][0-9][0-9]") as zip_code,
count(*) as num_clients
FROM bq_demo.client
GROUP BY zip_code
)
SELECT
CAST(geo_id as STRING) AS zip_code,
total_pop,
median_age,
households,
income_per_capita,
ROUND(SAFE_DIVIDE(employed_pop, pop_16_over),4) AS rate_employment,
num_clients
FROM
`bigquery-public-data.census_bureau_acs.zip_codes_2017_5yr`
JOIN customer_counts on zip_code = geo_id
ORDER BY num_clients DESC
- Klik Run
- Lihat Hasilnya

5. Pengelolaan Kapasitas
Bekerja dengan slot dan reservasi
BQ menawarkan beberapa model harga untuk memenuhi kebutuhan Anda. Sebagian besar pelanggan besar terutama memanfaatkan tarif tetap untuk harga yang dapat diprediksi dengan kapasitas yang dicadangkan. Untuk melakukan bursting di luar kapasitas dasar tersebut, BQ menawarkan slot fleksibel yang memungkinkan Anda meningkatkan kapasitas tambahan dengan cepat, lalu otomatis menyusut kembali tanpa memengaruhi kueri yang sedang berjalan. BQ juga memiliki model pemindaian byte yang memungkinkan Anda hanya membayar kueri yang dijalankan.
[Poin Pembicaraan Kompetitif: Beberapa pesaing bekerja secara eksklusif pada model kapasitas tetap di mana pelanggan harus mengalokasikan gudang virtual untuk setiap beban kerja di organisasi mereka. Selain model per kueri berbiaya rendah yang mempermudah penggunaan BigQuery, kami mendukung model harga kapasitas tarif tetap yang memungkinkan kapasitas tidak terpakai dibagikan di antara serangkaian workload.]
- Buka tab pemesanan.

- Klik "Beli Slot"

- Pilih "Fleksibel" sebagai durasi.
- Pilih 500 slot.
- Konfirmasi pembelian.

- Klik Lihat Komitmen Slot.
- Klik "Buat Pemesanan"
- Pengguna "demo" sebagai nama reservasi
- Pilih Amerika Serikat sebagai lokasi
- Ketik 500 untuk slot (semua tersedia)
- Klik Tugas
- Pilih project saat ini untuk project organisasi
- Pilih "demo" untuk ID reservasi
- Klik Buat."