Wizualizacja danych BigQuery w Studiu danych

Wizualizacja danych BigQuery w Studiu danych

Informacje o tym ćwiczeniu (w Codelabs)

subjectOstatnia aktualizacja: paź 11, 2020
account_circleAutorzy: Shane Glass

1. Wprowadzenie

Studio DanychBigQuery to potężne połączenie, które umożliwia tworzenie paneli, dzięki którym użytkownicy mogą zrozumieć informacje i statystyki zawarte w danych. Te panele można łatwo udostępniać za pomocą znanego interfejsu Dysku Google i osadzać w witrynach, aby jeszcze bardziej zwiększyć ich zasięg.

Co to jest Studio danych?

Studio danych to bezpłatne narzędzie Google do wizualizacji danych, które umożliwia:

  • wizualizacja danych w formie wykresów i tabel z wieloma możliwościami konfiguracji;
  • Łatwe i szybkie łączenie z różnymi źródłami danych.
  • udostępnianie statystyk zespołowi lub użytkownikom na całym świecie;
  • współpraca z zespołem nad raportami;
  • Twórz raporty jeszcze szybciej dzięki wbudowanym przykładowym raportom i wizualizacjom społeczności.

Z tego modułu dowiesz się, jak połączyć BigQuery i Studio danych, aby tworzyć panele i raporty, które pomogą Ci lepiej zrozumieć dane. Aby pokazać, jak to zrobić, użyjemy publicznych zbiorów danych z programu publicznych zbiorów danych w chmurze.

Co utworzysz

W tym ćwiczeniu utworzysz panel Studia danych. Panel będzie wizualizować publiczny zbiór danych BigQuery, łącząc BigQuery z Data Studio i określając najlepsze typy wizualizacji dla zbioru danych.

Czego się nauczysz

  • Jak połączyć BigQuery i Data Studio
  • Jak wizualizować dane w Studiu danych

Czego potrzebujesz

  • Konto Google Cloud. Jeśli jeszcze nie masz konta, możesz szybko zarejestrować się w piaskownicy BigQuery bez podawania danych karty kredytowej.
  • Podstawowa znajomość SQL jest przydatna, ale nie jest wymagana.
  • podstawowa znajomość sprawdzonych metod wizualizacji danych;

2. Przygotowania

Dostęp do publicznych zbiorów danych BigQuery

W tym ćwiczeniu wizualizujemy zgłoszenia 311 z San Francisco. Ten zbiór danych, a także ponad 150 innych, jest dostępny w ramach programu publicznych zbiorów danych BigQuery. Aby znaleźć inne zbiory danych, przejrzyj cały katalog dostępnych zbiorów danych. Używany przez nas zbiór danych dotyczących zgłoszeń na numer 311 jest dobrym przykładem zapytań do obsługi klienta, którymi wiele firm musi zarządzać.

Konfigurowanie projektu Google Cloud

W konsoli Google Cloud na stronie selektora projektu wybierz lub utwórz projekt w Google Cloud. Ta opcja jest dostępna w menu u góry po lewej stronie ekranu. Sprawdź, czy w projekcie Google Cloud włączone są płatności. Dowiedz się, jak sprawdzić, czy w projekcie włączone są płatności

4378f8fd21828a66.png

3. Łączenie Data Studio i BigQuery

Co to jest Studio danych?

Studio danych to bezpłatne narzędzie Google do wizualizacji danych, które pomaga użytkownikom wykorzystać potencjał danych dzięki interaktywnym panelom i interesującym raportom, które ułatwiają podejmowanie mądrzejszych decyzji biznesowych. Możesz połączyć się z ponad 500 zbiorami danych za pomocą ponad 200 łączników wbudowanych bezpośrednio w Studio danych. Obejmują one łączniki do usług Google, takich jak Google Analytics, BigQuery i Arkusze, a także do zewnętrznych źródeł danych.

Czym jest BigQuery?

BigQuery to w pełni zarządzana, wysoce skalowalna i ekonomiczna hurtownia danych w chmurze Google Cloud, która została zaprojektowana z myślą o elastyczności biznesowej. BigQuery umożliwia analizowanie petabajtów danych za pomocą ANSI SQL z błyskawiczną szybkością, uzyskiwanie statystyk dzięki analizom w czasie rzeczywistym i analizom predykcyjnym oraz łatwy dostęp do danych i udostępnianie statystyk. Wszystko to bezpłatnie operacyjnych.

Tworzenie źródła danych

Pierwszym krokiem w tworzeniu raportu w Studiu danych jest utworzenie źródła danych dla raportu. Raport może zawierać jedno lub więcej źródeł danych. Gdy tworzysz źródło danych BigQuery, Data Studio używa oprogramowania sprzęgającego BigQuery.

Aby dodać źródło danych BigQuery do raportu w Studio danych, musisz mieć odpowiednie uprawnienia. Ponadto uprawnienia zastosowane do zbiorów danych BigQuery będą miały zastosowanie do raportów, wykresów i paneli, które utworzysz w Studiu danych. Gdy raport Studia danych jest udostępniany, jego komponenty są widoczne tylko dla użytkowników, którzy mają odpowiednie uprawnienia.

Aby utworzyć źródło danych:

  1. Otwórz Studio danych.
  2. Na stronie Raporty w sekcji Zacznij od szablonu kliknij szablon Pusty. Spowoduje to utworzenie nowego raportu bez tytułu.

801a709b4a392db7.png

  1. W razie potrzeby skonfiguruj Ustawienia marketingoweKonto i prywatność, a następnie kliknij Zapisz. Po zapisaniu ustawień może być konieczne ponowne kliknięcie szablonu Pusty.
  2. W oknie Dodaj dane do raportu w sekcji Połącz z danymi kliknij BigQuery.

3fb927eb5317986e.png

  1. W sekcji Autoryzacja kliknij Autoryzuj. Dzięki temu Google Data Studio uzyska dostęp do Twoich projektów GCP.
  2. W oknie Prośba o uprawnienia kliknij Zezwól, aby umożliwić Studio danych Google wyświetlanie danych w BigQuery. Jeśli wcześniej korzystałeś(-aś) ze Studia danych Google, ten komunikat może się nie pojawić.
  3. W menu po lewej stronie domyślnie zaznaczona jest opcja Moje projekty. Zmień wybór na Publiczne zbiory danych.
  4. W sekcji Projekt rozliczeniowy kliknij nazwę utworzonego wcześniej projektu GCP.
  5. W sekcji Publiczne zbiory danych kliknij san_francisco_311.
  6. W przypadku tabeli kliknij 311_service_requests.
  7. W prawym dolnym rogu okna kliknij Dodaj. Jeśli pojawi się okno dialogowe z komunikatem „Zamierzasz dodać dane do tego raportu”, kliknij „DODAJ DO RAPORTU”, aby kontynuować.
  8. W menu Studio danych kliknij Zarządzaj dodanymi źródłami danych w sekcji Zasoby c1aadb68dd5bf34f.png.
  9. Na stronie Źródła danych kliknij Edytuj obok pozycji 311_service_requests, aby wyświetlić pola tabeli i ich typy danych. Na tej stronie możesz dostosować właściwości pola lub utworzyć nowe pola obliczeniowe. f0250903710fc9ed.png
  10. Ten zbiór danych zawiera wewnętrzny punkt geograficzny każdej dzielnicy przedstawiony w sposób, który Studio danych może natywnie wykorzystywać. Obok pola neighborhood_center_ds zmień typ danych. W tym celu kliknij text, a następnie z menu Geo wybierz Latitude, Longitude (Szerokość i długość geograficzna). Informuje to Studio danych, że pole danych powinno być reprezentowane geograficznie.

1f979cf54681ae12.png

Zbiór danych BigQuery został połączony ze Studio danych.

4. Tworzenie wizualizacji

Po połączeniu zbioru danych BigQuery (w tym przypadku publicznego zbioru danych BigQuery San Francisco 311 requests) możesz rozpocząć wizualizację danych. Data Studio automatycznie utworzy pierwszą wizualizację na podstawie Twoich danych. Możesz go teraz usunąć, aby utworzyć pusty szablon.

94aea5bb5fc4ffe1.png

Tworzenie mapy drzewa

Zaczniemy od utworzenia mapy drzewa, aby wizualnie przedstawić, jaki rodzaj zgłoszenia do numeru 311 jest najczęściej przesyłany. Dzięki temu uzyskamy punkt wyjścia do tworzenia innych wizualizacji, ponieważ dowiemy się, na jakich typach żądań warto się skupić.

  1. W menu Data Studio kliknij Dodaj wykres, a następnie u dołu wybierz Mapa drzewa. Ta opcja może być widoczna dopiero po przewinięciu strony.

677663906bdd050f.png 2. W Studiu danych możesz kliknąć lub przeciągnąć obszar na kanwie, aby utworzyć wizualizację. Zacznij od umieszczenia go w lewym dolnym rogu panelu. Data Studio automatycznie utworzy mapę drzewa, zgadując, które pola chcesz uwzględnić.

c593d3313b5ce89.png 3. Kliknij mapę drzewa, aby wprowadzić zmiany w wizualizowanych danych. W panelu po prawej stronie ekranu zmień parametry, aby pasowały do wizualizacji poniżej.

869db54f9ef19ea3.png

  1. U góry panelu kliknij Styl. Użyjemy tej funkcji, aby wprowadzić drobne zmiany, które ułatwią odczytywanie mapy drzewa. Zmieńmy kolor typów żądań o największej liczbie wartości. Kliknij przycisk wyróżniony poniżej i wybierz odcień niebieskiego z zaznaczeniem. Dzięki temu tekst na mapie drzewa będzie lepiej widoczny.

db4e4505d51f1539.png c04e33d3aa35e7b.png 5. Gdy skończysz, Twój panel powinien wyglądać mniej więcej tak:

af147fc5a4c40d15.png

5. Tworzenie panelu

Jednym z głównych celów panelu jest umożliwienie łatwego raportowania danych na większą skalę, aby wspierać proces podejmowania decyzji. W tym celu dołączamy dane i statystyki niezbędne do zapewnienia odpowiedniego kontekstu dla zbioru danych w łatwo przyswajalnym formacie.

Kontynuujmy tworzenie panelu, dodając kilka elementów, które ułatwią zrozumienie i interpretację tych informacji. Zacznijmy od dodania mapy, która pokazuje, w których dzielnicach jest najwięcej zgłoszeń, oraz podsumowań statystyk, które informują o łącznej liczbie zgłoszeń w przypadku 3 najpopularniejszych typów zgłoszeń.

Dodawanie mapy do panelu

  1. W menu kliknij Dodaj wykres, a następnie w menu wybierz Mapy Google. Możesz też użyć mapy geograficznej, ale wizualizacje w Mapach Google zapewniają więcej kontekstu, co sprawia, że lepiej pasują do tego przypadku użycia.

806f9ddfe45a242c.png 2. Dodaj wykres w prawym dolnym rogu panelu w taki sam sposób jak mapę drzewa. 3. Aby zmienić parametry mapy, wybierz ją w panelu. Następnie zmień opcje na karcie Dane, aby pasowały do poniższych wyborów. Aby to zrobić, dodaj pole „dzielnica” do wymiaru Etykietka, a „liczbę rekordów” do Rozmiaru bąbelka w sekcji danych.

fc764cf8ec84558d.png 4. Po zakończeniu panel powinien wyglądać podobnie do tego:

59c06b3b041ff950.png

Dodawanie podsumowań statystyk do panelu

Następnie dodamy do panelu 3 podsumowania statystyk. Karty wyników umożliwiają wyświetlanie wartości przefiltrowanej zmiennej, co pomaga użytkownikom panelu skupić się na najważniejszych danych. Utworzymy 3 filtry, a następnie zastosujemy je do kart wyników. W ten sposób utworzysz 3 karty wyników, które będą wyświetlać użytkownikom liczbę zgłoszeń dotyczących „Czyszczenia ulic i chodników”, „Graffiti” i „Obozowisk”. Są to 3 najczęściej zgłaszane typy usług, które zostały określone na podstawie utworzonej wcześniej mapy drzewa.

  1. W menu kliknij Dodaj wykres, a następnie w menu wybierz Podsumowanie statystyk. Zobaczysz 2 opcje: Podsumowanie statystyk i Podsumowanie statystyk ze skróconymi liczbami. Oba te rozwiązania sprawdzą się w tym przypadku.

cf41ed6d758d4b3d.png 2. Dodaj podsumowanie statystyk nad mapą drzewa na panelu i upewnij się, że jako dane wybrano pole „liczba rekordów”. Skopiuj go i wklej, aby utworzyć 2 kolejne elementy rozmieszczone na panelu. d72dff7b5ada3ab3.png 3. Wybierz kartę wyników najbardziej po lewej stronie. W panelu Dane po prawej stronie kliknij Dodaj filtr i utwórz filtr zgodny z parametrami poniżej. Karta wyników zostanie automatycznie zaktualizowana, aby filtrować liczbę rekordów i uwzględniać zgłoszenia serwisowe spełniające kryteria filtrów.

5f88670d31341a11.png 4. Zrób to samo w przypadku środkowego i prawego podsumowania statystyk, aby utworzyć podsumowania statystyk pokazujące liczbę zgłoszeń z kategoriami „Graffiti” i „Obozowiska”. Kliknięcie Dodaj filtr spowoduje wyświetlenie „selektora filtrów”, który zawiera wszystkie utworzone już filtry. Aby utworzyć nowe filtry, u dołu kliknij Utwórz filtr. Po utworzeniu filtrów wartości powinny zostać automatycznie zaktualizowane, aby odzwierciedlać nowe parametry karty wyników. 5. Zaznacz wszystkie 3 obiekty podsumowania statystyk jednocześnie, przytrzymując klawisz Shift i klikając je, a następnie kliknij Style w panelu, aby zmodyfikować styl podsumowań statystyk. Wprowadzone przez Ciebie zmiany zostaną zastosowane jednocześnie do wszystkich 3 kart wyników. Zaktualizuj styl podsumowań statystyk, aby pasował do ustawień panelu poniżej, ale nie przejmuj się, jeśli kolory będą się nieco różnić. Wybierzemy opcję „Ukryj nazwę danych” (obecnie w panelu widoczna jako „Liczba rekordów”), aby móc wstawić własny tekst i sprawić, że znaczenie tych danych będzie bardziej zrozumiałe dla osób przeglądających panel. 41e5c8035b09e55f.png 6. Dodaj tekst nad kartami wyników, aby użytkownicy wiedzieli, co oznaczają dane. Na pasku narzędzi kliknij ikonę Tekst. Narysuj pole na obszarze roboczym, a następnie wpisz w nim tekst.

66016180009f92f.png

Panel powinien wyglądać tak: 27f6ec27f3b39816.png

6. Tworzenie filtrów

Filtry w Data Studio umożliwiają zawężanie lub ograniczanie danych odzwierciedlonych na wykresie. Filtr definiuje się przez ustawienie kryteriów podobnych do instrukcji WHERE w SQL. Filtry mogą być kierowane na określony zakres wartości w przypadku co najmniej 1 wymiaru zbioru danych, np. ograniczać dane do określonego zakresu dat. Filtry możesz stosować na różnych poziomach:

  • Na poziomie wykresu: filtr jest stosowany tylko do jednego konkretnego wykresu.
  • Na poziomie grupy: filtr jest stosowany do grupy wybranych wykresów.
  • Na poziomie strony: filtrowane są wszystkie wykresy na tej stronie.
  • Na poziomie raportu: wszystkie wykresy w raporcie są filtrowane.

Gdy mamy już większość elementów panelu, dodajmy element sterujący filtrem, który umożliwi widzom interaktywne wybieranie co najmniej jednej dzielnicy, która ma być odzwierciedlona w elementach wizualnych raportu podczas jego przeglądania.

  1. W menu Studio danych kliknij Opcja kontroli filtra.

1a87123245ba52b4.png 2. Kliknij obszar roboczy panelu, aby umieścić kontrolkę filtra, tak jak w przypadku dodawania wykresów. 3. Upewnij się, że w panelu Dane wymiar filtra jest ustawiony na „dzielnica”. 4. Wybierz filtr, klikając go w panelu. Następnie na pasku menu u góry kliknij Rozmieść i wybierz Ustaw jako poziom strony. Jeśli nie możesz wybrać tej opcji, oznacza to, że filtr jest już ustawiony na poziomie strony i po zmodyfikowaniu będzie filtrować wszystkie wykresy na tej stronie.

W ten sposób utworzysz odpowiedni panel do użytku.

7. Przetestuj i udostępnij

Testowanie panelu

Panel jest już gotowy, więc przyjrzyjmy się mu z perspektywy widza, aby upewnić się, że wszystko działa zgodnie z oczekiwaniami.

W prawym górnym rogu kliknij Wyświetl, aby zobaczyć panel z perspektywy widzów.

d4d3065d022ff92a.png

Udostępnianie panelu

Gdy wszystko będzie wyglądać tak, jak chcesz, możesz udostępnić panel. Studio danych ułatwia udostępnianie paneli dzięki znajomemu interfejsowi udostępniania, który jest używany w Arkuszach, Dokumentach i innych usługach G Suite.

Zacznij od zmiany nazwy panelu, aby użytkownicy mogli go łatwiej znaleźć. W lewym górnym rogu kliknij nazwę raportu („Bez tytułu”) i zmień ją na „San Francisco 311 Requests by Neighborhood”.

Kliknięcie przycisku Udostępnij w prawym górnym rogu otworzy interfejs udostępniania z wieloma opcjami, w tym udostępnianiem poszczególnym użytkownikom przez e-mail, udostępnianiem w domenie lub udostępnianiem publicznym wszystkim użytkownikom. To ostatnie ustawienie jest szczególnie przydatne, jeśli chcesz umieścić raport w publicznej witrynie.

752a2679c7d6b8ec.png

Dalsze kroki

Aby dowiedzieć się więcej o tym, jak narzędzia analityki biznesowej Google Cloud mogą zaspokoić Twoje potrzeby, wyszukaj „Studio danych” u góry strony i zapoznaj się z dodatkowymi warsztatami programistycznymi . Wypatruj kolejnych Codelabs, w których poznasz najnowsze narzędzie BI od Google Cloud, czyli Looker.

Możesz też przyspieszyć działanie paneli, korzystając z pamięci o pojemności do 100 GB za pomocą mechanizmu analityki biznesowej BigQuery. Mechanizm analityki biznesowej to szybka i działająca w pamięci usługa analizy, która umożliwia użytkownikom interaktywne przeglądanie złożonych zbiorów danych w BigQuery z czasami wykonywania zapytań poniżej jednej sekundy i wysokim poziomem równoczesności. Płynnie integruje się ze Studio danych, dzięki czemu możesz szybciej przeglądać i analizować dane, a Twoje panele stają się jeszcze bardziej przydatne dla odbiorców.