Trực quan hoá dữ liệu BigQuery trong Data Studio

1. Giới thiệu

Data StudioBigQuery kết hợp với nhau tạo thành một bộ đôi mạnh mẽ, cho phép bạn tạo trang tổng quan giúp người dùng hiểu được thông tin và thông tin chi tiết trong dữ liệu của bạn. Bạn có thể dễ dàng chia sẻ các trang tổng quan này bằng giao diện quen thuộc của Google Drive và nhúng vào các trang web để phân phối rộng rãi hơn nữa.

Data Studio là gì?

Data Studio là công cụ trực quan hoá dữ liệu miễn phí của Google, cho phép bạn:

  • Trực quan hoá dữ liệu của bạn thông qua các biểu đồ và bảng có thể định cấu hình ở mức độ cao.
  • Kết nối với nhiều nguồn dữ liệu một cách nhanh chóng và dễ dàng.
  • Chia sẻ thông tin chi tiết của bạn với cả nhóm hoặc những người khác.
  • Cộng tác trên các báo cáo với cả nhóm.
  • Tạo báo cáo nhanh hơn nữa nhờ các mẫu báo cáo và hình ảnh trực quan do cộng đồng tạo

Lớp học lập trình này sẽ hướng dẫn bạn cách kết nối BigQuery và Data Studio để tạo trang tổng quan và báo cáo có thể giúp bạn hiểu rõ hơn về dữ liệu của mình. Chúng tôi sẽ sử dụng các tập dữ liệu công khai trong Chương trình tập dữ liệu công khai trên đám mây để minh hoạ cách thực hiện việc này.

Sản phẩm bạn sẽ tạo ra

Trong lớp học lập trình này, bạn sẽ tạo một trang tổng quan Data Studio. Trang tổng quan của bạn sẽ trực quan hoá một Tập dữ liệu công khai trên BigQuery bằng cách kết nối BigQuery với Data Studio và xác định các loại hình ảnh trực quan phù hợp nhất cho tập dữ liệu.

Kiến thức bạn sẽ học được

  • Cách kết nối BigQuery và Data Studio
  • Cách trực quan hoá dữ liệu trong Data Studio

Bạn cần có

  • Tài khoản Google Cloud. Nếu chưa có tài khoản, bạn có thể đăng ký nhanh hộp cát BigQuery mà không cần thẻ tín dụng.
  • Bạn nên có kiến thức cơ bản về SQL nhưng không bắt buộc
  • Hiểu biết cơ bản về các phương pháp hay nhất để trực quan hoá dữ liệu

2. Thiết lập

Truy cập vào Tập dữ liệu công khai của BigQuery

Trong lớp học lập trình này, bạn sẽ hình dung 311 yêu cầu từ Thành phố San Francisco. Tập dữ liệu này cùng với hơn 150 tập dữ liệu khác có trong Chương trình tập dữ liệu công khai của BigQuery. Khám phá toàn bộ danh mục tập dữ liệu có sẵn để tìm các tập dữ liệu khác. Tập dữ liệu gồm các yêu cầu đến số 311 mà chúng tôi đang sử dụng là một chỉ số đại diện phù hợp cho loại yêu cầu dịch vụ khách hàng mà nhiều công ty cần quản lý.

Thiết lập dự án trên Google Cloud

Trong Cloud Console, trên trang bộ chọn dự án, hãy chọn hoặc tạo một dự án trên Cloud. Lựa chọn này có trong trình đơn thả xuống ở phần trên cùng bên trái của màn hình. Đảm bảo bạn đã bật tính năng thanh toán cho dự án trên Google Cloud. Tìm hiểu cách xác nhận rằng tính năng thanh toán đã được bật cho dự án của bạn.

4378f8fd21828a66.png

3. Kết nối Data Studio và BigQuery

Data Studio là gì?

Data Studio là công cụ trực quan hoá dữ liệu miễn phí của Google, giúp người dùng khai thác sức mạnh của dữ liệu thông qua các trang tổng quan có tính tương tác cao và báo cáo đẹp mắt, giúp họ đưa ra các quyết định kinh doanh sáng suốt hơn. Bạn có thể kết nối với hơn 500 bộ dữ liệu từ hơn 200 trình kết nối được tích hợp trực tiếp vào Data Studio. Trong đó có các trình kết nối đến các sản phẩm của Google như Google Analytics, BigQuery và Trang tính, cũng như các nguồn dữ liệu bên ngoài.

BigQuery là gì?

BigQuery là kho dữ liệu trên đám mây do Google Cloud toàn quyền quản lý, có khả năng mở rộng cao và tiết kiệm chi phí, được thiết kế để giúp đảm bảo tính linh hoạt trong hoạt động kinh doanh. BigQuery cho phép bạn phân tích dữ liệu cỡ petabyte bằng ANSI SQL với tốc độ cực nhanh, thu thập thông tin chi tiết bằng tính năng phân tích dự đoán và theo thời gian thực, đồng thời dễ dàng truy cập vào dữ liệu và chia sẻ thông tin chi tiết. Tất cả đều không có chi phí vận hành.

Tạo nguồn dữ liệu

Bước đầu tiên để tạo báo cáo trong Data Studio là tạo một nguồn dữ liệu cho báo cáo. Một báo cáo có thể chứa một hoặc nhiều nguồn dữ liệu. Khi bạn tạo một nguồn dữ liệu BigQuery, Data Studio sẽ sử dụng trình kết nối BigQuery.

Bạn phải có các quyền thích hợp để thêm một nguồn dữ liệu BigQuery vào báo cáo Data Studio. Ngoài ra, các quyền được áp dụng cho tập dữ liệu BigQuery sẽ áp dụng cho các báo cáo, biểu đồ và trang tổng quan mà bạn tạo trong Data Studio. Khi một báo cáo Data Studio được chia sẻ, chỉ những người dùng có quyền thích hợp mới nhìn thấy các thành phần của báo cáo.

Cách tạo một nguồn dữ liệu:

  1. Mở Data Studio.
  2. Trên trang Báo cáo, trong phần Bắt đầu bằng một mẫu, hãy nhấp vào mẫu Trống. Thao tác này sẽ tạo một báo cáo mới không có tiêu đề.

801a709b4a392db7.png

  1. Nếu được nhắc, hãy hoàn tất chế độ cài đặt Lựa chọn ưu tiên về hoạt động tiếp thịTài khoản và quyền riêng tư, rồi nhấp vào Lưu. Bạn có thể phải nhấp lại vào mẫu Trống sau khi lưu chế độ cài đặt.
  2. Trong cửa sổ Thêm dữ liệu vào báo cáo, hãy xem mục Kết nối với dữ liệu rồi chọn BigQuery bằng cách nhấp vào

3fb927eb5317986e.png

  1. Đối với Uỷ quyền, hãy nhấp vào Uỷ quyền. Nhờ đó, Google Data Studio có thể truy cập vào các dự án GCP của bạn.
  2. Trong hộp thoại Yêu cầu cấp quyền, hãy nhấp vào Cho phép để cấp cho Google Data Studio quyền xem dữ liệu trong BigQuery. Bạn có thể không nhận được lời nhắc này nếu trước đây đã sử dụng Google Data Studio.
  3. Trong bảng điều hướng bên trái, bạn sẽ thấy mục Dự án của tôi được chọn theo mặc định. Thay đổi lựa chọn thành Tập dữ liệu công khai.
  4. Đối với Dự án thanh toán, hãy nhấp vào tên của dự án GCP mà bạn đã tạo trước đó.
  5. Trong mục Tập dữ liệu công khai, hãy nhấp vào san_francisco_311.
  6. Đối với bảng, hãy nhấp vào 311_service_requests.
  7. Ở góc dưới bên phải của cửa sổ, hãy nhấp vào Thêm. Nếu bạn thấy hộp thoại "Bạn sắp thêm dữ liệu vào báo cáo này", hãy nhấp vào "THÊM VÀO BÁO CÁO" để tiếp tục.
  8. Nhấp vào Quản lý nguồn dữ liệu đã thêm trong mục Tài nguyên trong trình đơn Data Studio c1aadb68dd5bf34f.png
  9. Nhấp vào Chỉnh sửa bên cạnh 311_service_requests trên trang Nguồn dữ liệu để xem các trường của bảng và kiểu dữ liệu của các trường đó. Bạn có thể sử dụng trang này để điều chỉnh các thuộc tính của trường hoặc tạo các trường được tính toán mới. f0250903710fc9ed.png
  10. Tập dữ liệu này bao gồm điểm địa lý nội bộ của từng khu dân cư được biểu thị theo cách mà Data Studio có thể sử dụng một cách tự nhiên. Bên cạnh trường neighborhood_center_ds, hãy thay đổi loại dữ liệu bằng cách nhấp vào text, sau đó chọn Latitude, Longitude (Vĩ độ, Kinh độ) trong trường thả xuống Geo (Địa lý). Thao tác này cho Data Studio biết rằng trường dữ liệu của chúng ta phải được biểu thị theo vị trí địa lý.

1f979cf54681ae12.png

Giờ đây, bạn đã kết nối tập dữ liệu BigQuery với Data Studio!

4. Tạo hình ảnh trực quan

Giờ đây, bạn đã kết nối thành công tập dữ liệu BigQuery (trong trường hợp này là Tập dữ liệu công khai của BigQuery Yêu cầu 311 của San Francisco), bạn có thể bắt đầu trực quan hoá dữ liệu. Data Studio sẽ tự động tạo hình ảnh trực quan đầu tiên dựa trên dữ liệu của bạn. Bạn có thể xoá phần này để tạo một mẫu trống.

94aea5bb5fc4ffe1.png

Tạo biểu đồ cây

Chúng ta sẽ bắt đầu bằng cách tạo một biểu đồ cây để trực quan hoá loại yêu cầu 311 thường được thực hiện nhất. Điều này sẽ giúp chúng ta có điểm bắt đầu cho các hình ảnh trực quan khác bằng cách cho biết những loại yêu cầu mà chúng ta có thể muốn tập trung vào.

  1. Nhấp vào Thêm biểu đồ trong trình đơn Data Studio, sau đó chọn Biểu đồ cây ở dưới cùng. Bạn có thể phải di chuyển xuống để thấy thẻ này.

677663906bdd050f.png 2. Data Studio sẽ cho phép bạn nhấp hoặc kéo một vùng trong canvas để tạo hình ảnh trực quan. Bắt đầu bằng cách đặt biểu đồ này ở góc dưới cùng bên trái của trang tổng quan. Data Studio sẽ tự động tạo một biểu đồ cây bằng cách đoán những trường mà bạn muốn đưa vào.

c593d3313b5ce89.png 3. Nhấp vào biểu đồ cây để thay đổi dữ liệu được trực quan hoá. Trong bảng điều khiển ở bên phải màn hình, hãy thay đổi các thông số sao cho phù hợp với hình ảnh trực quan bên dưới.

869db54f9ef19ea3.png

  1. Nhấp vào Kiểu ở đầu bảng điều khiển. Chúng ta sẽ dùng thông tin này để thực hiện một số thay đổi nhỏ nhằm giúp biểu đồ cây dễ đọc hơn. Hãy thay đổi màu của các loại yêu cầu có nhiều giá trị nhất. Nhấp vào nút được đánh dấu bên dưới rồi chọn sắc độ xanh dương có dấu đánh dấu. Điều này giúp chúng ta có độ tương phản tốt hơn với văn bản trong biểu đồ cây.

db4e4505d51f1539.png c04e33d3aa35e7b.png 5. Sau khi hoàn tất, trang tổng quan của bạn sẽ có dạng như sau:

af147fc5a4c40d15.png

5. Tạo trang tổng quan

Một trong những mục đích chính của trang tổng quan là giúp bạn dễ dàng báo cáo các chỉ số trên cơ sở có thể mở rộng hơn để hỗ trợ việc đưa ra quyết định. Chúng tôi thực hiện việc này bằng cách đưa dữ liệu và các chỉ số cần thiết để cung cấp bối cảnh phù hợp cho một tập dữ liệu ở định dạng dễ hiểu.

Hãy tiếp tục xây dựng trang tổng quan bằng cách thêm một số phần tử để giúp thông tin này dễ hiểu và dễ diễn giải hơn. Hãy bắt đầu bằng cách thêm một bản đồ làm nổi bật những khu vực lân cận có nhiều yêu cầu nhất và thẻ điểm cho biết tổng số yêu cầu đối với 3 loại yêu cầu hàng đầu.

Thêm bản đồ vào trang tổng quan

  1. Nhấp vào Thêm biểu đồ trong trình đơn, sau đó chọn Google Maps trong trình đơn thả xuống. Bạn cũng có thể sử dụng Geo Map, nhưng hình ảnh trực quan của Google Maps cung cấp nhiều bối cảnh hơn, phù hợp hơn với trường hợp sử dụng này.

806f9ddfe45a242c.png 2. Thêm biểu đồ vào phần dưới cùng bên phải của trang tổng quan theo cách bạn đã thực hiện với biểu đồ cây. 3. Chọn bản đồ trên trang tổng quan để thay đổi các thông số của bản đồ. Sau đó, hãy sửa đổi các lựa chọn trong thẻ Dữ liệu cho phù hợp với các lựa chọn bên dưới. Để thực hiện việc này, hãy thêm trường "khu vực lân cận" vào phương diện Chú thích và "số lượng bản ghi" vào Kích thước bong bóng trong chỉ số.

fc764cf8ec84558d.png 4. Sau khi hoàn tất, trang tổng quan của bạn sẽ có dạng như sau:

59c06b3b041ff950.png

Thêm thẻ điểm vào trang tổng quan

Tiếp theo, chúng ta sẽ thêm 3 thẻ điểm vào trang tổng quan. Thẻ điểm cho phép bạn cho thấy giá trị của một biến được lọc, giúp người dùng trang tổng quan tập trung vào những chỉ số quan trọng nhất. Chúng ta sẽ tạo 3 bộ lọc, sau đó áp dụng cho thẻ điểm. Thao tác này sẽ tạo 3 thẻ điểm cho người dùng biết số lượng yêu cầu dịch vụ thuộc loại "Vệ sinh đường phố và vỉa hè", "Vẽ bậy" và "Khu cắm trại". Đây là 3 loại dịch vụ được yêu cầu nhiều nhất, theo cây bản đồ được tạo trước đó.

  1. Nhấp vào Thêm biểu đồ trong trình đơn, rồi chọn Thẻ điểm trong trình đơn thả xuống. Bạn sẽ thấy 2 lựa chọn: Thẻ điểm và Thẻ điểm có số liệu thu gọn. Cả hai cách này đều phù hợp với trường hợp sử dụng dự kiến.

cf41ed6d758d4b3d.png 2. Thêm thẻ điểm phía trên bản đồ cây trong trang tổng quan và đảm bảo bạn đã chọn trường "số lượng bản ghi" làm chỉ số. Sao chép và dán để tạo 2 chỉ báo khác được đặt cách đều nhau trên trang tổng quan. d72dff7b5ada3ab3.png 3. Chọn thẻ điểm ở ngoài cùng bên trái. Trong bảng Dữ liệu ở bên phải, hãy chọn Thêm bộ lọc rồi tạo một bộ lọc khớp với các thông số bên dưới. Thẻ điểm sẽ tự động cập nhật để lọc số lượng bản ghi, bao gồm cả những yêu cầu dịch vụ đáp ứng tiêu chí lọc.

5f88670d31341a11.png 4. Làm tương tự cho thẻ điểm ở giữa và thẻ điểm bên phải để tạo các thẻ điểm cho biết số lượng yêu cầu thuộc danh mục "Vẽ bậy" và "Khu cắm trại". Khi bạn nhấp vào Thêm bộ lọc, "Bộ chọn bộ lọc" sẽ xuất hiện, cho thấy tất cả các bộ lọc đã được tạo. Nhấp vào Tạo bộ lọc ở dưới cùng để tạo bộ lọc mới. Sau khi tạo bộ lọc, bạn sẽ thấy các giá trị tự động cập nhật để phản ánh các thông số mới cho thẻ điểm. 5. Chọn cả 3 đối tượng thẻ điểm cùng một lúc bằng cách giữ phím Shift rồi nhấp vào các đối tượng đó, sau đó nhấp vào Kiểu trong bảng điều khiển để sửa đổi kiểu của thẻ điểm. Những nội dung bạn chỉnh sửa bây giờ sẽ được áp dụng cho cả 3 thẻ điểm cùng một lúc. Cập nhật kiểu của thẻ điểm cho phù hợp với chế độ cài đặt bảng điều khiển bên dưới, nhưng đừng lo lắng nếu màu sắc của bạn hơi khác. Chúng ta sẽ chọn "Ẩn tên chỉ số" (hiện đang hiển thị là "Số lượng bản ghi" trên trang tổng quan) để có thể đặt văn bản của riêng mình vào vị trí đó và giúp người xem trang tổng quan hiểu rõ hơn ý nghĩa của các chỉ số này. 41e5c8035b09e55f.png 6. Thêm văn bản phía trên thẻ điểm để người dùng biết các chỉ số này thể hiện điều gì. Trên thanh công cụ, hãy nhấp vào biểu tượng Văn bản. Vẽ một hộp trên canvas rồi nhập văn bản vào hộp đó.

66016180009f92f.png

Trang tổng quan của bạn sẽ có dạng như sau: 27f6ec27f3b39816.png

6. Tạo bộ lọc

Bộ lọc trong Data Studio cho phép bạn tinh chỉnh hoặc giảm dữ liệu được phản ánh trong biểu đồ. Bạn xác định bộ lọc bằng cách đặt tiêu chí, tương tự như câu lệnh WHERE trong SQL. Bộ lọc có thể nhắm đến một phạm vi giá trị cụ thể cho một hoặc nhiều phương diện của tập dữ liệu, chẳng hạn như giới hạn dữ liệu trong một phạm vi ngày cụ thể. Bạn có thể áp dụng bộ lọc ở nhiều cấp độ:

  • Cấp biểu đồ: Bộ lọc chỉ được áp dụng cho một biểu đồ cụ thể.
  • Cấp nhóm: Bộ lọc được áp dụng cho một nhóm biểu đồ đã chọn.
  • Cấp trang: Tất cả biểu đồ trên trang đó đều được lọc.
  • Cấp báo cáo: Tất cả biểu đồ trong báo cáo đều được lọc.

Bây giờ, khi đã có phần lớn trang tổng quan, hãy thêm một chế độ kiểm soát bộ lọc để người xem có thể chọn một hoặc nhiều khu vực lân cận mà họ muốn xuất hiện trong hình ảnh báo cáo khi xem xét.

  1. Nhấp vào Bộ lọc trong trình đơn Data Studio

1a87123245ba52b4.png 2. Nhấp vào canvas của trang tổng quan để đặt chế độ kiểm soát bộ lọc, giống như khi bạn thêm biểu đồ trước đây. 3. Đảm bảo rằng phương diện bộ lọc được đặt thành "khu vực lân cận" trong bảng Dữ liệu nếu chưa được đặt. 4. Chọn bộ lọc bằng cách nhấp vào bộ lọc đó trong trang tổng quan. Sau đó, nhấp vào Sắp xếp trong thanh trình đơn trên cùng rồi chọn Tạo cấp trang. Nếu bạn không chọn được lựa chọn đó, thì bộ lọc đã được đặt ở cấp trang và sẽ lọc tất cả biểu đồ trên trang đó khi được sửa đổi.

Vậy là bạn đã có một trang tổng quan phù hợp để sử dụng!

7. Hãy thử và chia sẻ

Kiểm thử trang tổng quan

Bây giờ, trang tổng quan đã hoàn tất. Hãy xem trang tổng quan này dưới góc độ của người xem để đảm bảo mọi thứ hoạt động như mong đợi.

Nhấp vào Xem ở góc trên cùng bên phải để xem trang tổng quan dưới góc độ của người xem.

d4d3065d022ff92a.png

Chia sẻ trang tổng quan

Sau khi mọi thứ đã đúng như bạn muốn, bạn có thể chia sẻ trang tổng quan của mình. Data Studio giúp bạn dễ dàng chia sẻ trang tổng quan bằng cách sử dụng giao diện chia sẻ quen thuộc trong Google Trang tính, Tài liệu và các sản phẩm khác của G Suite.

Bắt đầu bằng cách thay đổi tên trang tổng quan để người dùng có thể dễ dàng tìm thấy trang tổng quan đó. Nhấp vào tên báo cáo ("Không có tiêu đề") ở góc trên cùng bên trái rồi đổi tên thành "Yêu cầu 311 của San Francisco theo khu vực lân cận".

Khi nhấp vào nút Chia sẻ ở góc trên cùng bên phải, giao diện chia sẻ sẽ mở ra với một số lựa chọn, bao gồm cả việc chia sẻ với từng người dùng qua email, chia sẻ theo miền hoặc cung cấp công khai cho tất cả người dùng. Chế độ cài đặt cuối cùng này đặc biệt hữu ích nếu bạn muốn nhúng báo cáo vào một trang web công khai.

752a2679c7d6b8ec.png

Các bước tiếp theo

Hãy xem thêm các lớp học lập trình bằng cách tìm kiếm "Data Studio" ở đầu trang để tìm hiểu thêm về cách các công cụ thông tin doanh nghiệp của Google Cloud có thể hỗ trợ nhu cầu của bạn. Hãy chú ý theo dõi các Lớp học lập trình trong tương lai để khám phá công cụ BI mới nhất của Google Cloud, Looker!

Bạn cũng có thể tăng tốc trang tổng quan bằng cách sử dụng tối đa 100 GB bộ nhớ trong bằng BigQuery BI Engine. BI Engine là một dịch vụ phân tích trong bộ nhớ có tốc độ cao, cho phép người dùng khám phá các tập dữ liệu phức tạp trong BigQuery một cách tương tác với thời gian phản hồi truy vấn dưới một giây và mức độ đồng thời cao. BigQuery tích hợp liền mạch với Data Studio để đẩy nhanh quá trình khám phá và phân tích dữ liệu, giúp trang tổng quan của bạn trở nên mạnh mẽ hơn nữa đối với người xem.