데이터 스튜디오에서 BigQuery 데이터 시각화

데이터 스튜디오에서 BigQuery 데이터 시각화

이 Codelab 정보

subject최종 업데이트: 10월 11, 2020
account_circle작성자: Shane Glass

1. 소개

데이터 스튜디오BigQuery를 함께 사용하면 사용자가 데이터의 정보와 통계를 이해할 수 있는 대시보드를 만들 수 있습니다. 이러한 대시보드는 Google Drive의 친숙한 인터페이스를 사용하여 쉽게 공유할 수 있으며, 사이트에 삽입하여 더 광범위하게 배포할 수도 있습니다.

데이터 스튜디오는 다음과 같은 작업을 할 수 있는 Google의 무료 데이터 시각화 도구입니다.

  • 고도의 설정이 가능한 차트와 표를 통해 데이터를 시각화합니다.
  • 다양한 데이터 소스에 빠르고 쉽게 연결
  • 유용한 정보를 팀 또는 전 세계와 공유
  • 보고서를 팀과 공동으로 작업
  • 기본 제공되는 샘플 보고서와 커뮤니티 시각화를 사용하여 더 빠르게 보고서 만들기

이 Codelab에서는 BigQuery와 데이터 스튜디오를 연결하여 데이터를 더 잘 이해하는 데 도움이 되는 대시보드와 보고서를 만드는 방법을 안내합니다. Cloud 공개 데이터 세트 프로그램의 공개 데이터 세트를 사용하여 이 작업을 수행하는 방법을 보여드리겠습니다.

빌드할 항목

이 Codelab에서는 데이터 스튜디오 대시보드를 빌드합니다. BigQuery를 데이터 스튜디오에 연결하고 데이터 세트에 가장 적합한 시각화 유형을 결정하여 대시보드에서 BigQuery 공개 데이터 세트를 시각화합니다.

학습할 내용

  • BigQuery와 데이터 스튜디오를 연결하는 방법
  • 데이터 스튜디오에서 데이터를 시각화하는 방법

필요한 항목

  • Google Cloud 계정 아직 계정이 없는 경우 신용카드 없이 BigQuery 샌드박스에 빠르게 가입할 수 있습니다.
  • SQL에 대한 기본 지식이 있으면 도움이 되지만 필수는 아닙니다.
  • 데이터 시각화 권장사항에 대한 기본적인 이해

2. 설정

BigQuery 공개 데이터 세트 액세스

이 Codelab에서는 샌프란시스코 시의 311 요청을 시각화합니다. 이 데이터 세트를 비롯한 150개가 넘는 데이터 세트는 BigQuery 공개 데이터 세트 프로그램을 통해 제공됩니다. 사용 가능한 데이터 세트 카탈로그 전체를 탐색하여 다른 데이터 세트를 찾아보세요. Google에서 사용하는 311 요청 데이터 세트는 많은 기업이 관리해야 하는 고객 서비스 요청 유형을 잘 나타냅니다.

Google Cloud 프로젝트 설정

Cloud Console의 프로젝트 선택기 페이지에서 Cloud 프로젝트를 선택하거나 만듭니다. 이 옵션은 화면 왼쪽 상단의 드롭다운 메뉴에서 사용할 수 있습니다. Google Cloud 프로젝트에 결제가 사용 설정되어 있는지 확인합니다. 프로젝트에 결제가 사용 설정되어 있는지 확인하는 방법을 알아보세요.

4378f8fd21828a66.png

3. Data Studio와 BigQuery 연결

데이터 스튜디오란 무엇인가요?

데이터 스튜디오는 Google의 무료 데이터 시각화 도구로, 사용자가 대화형 대시보드와 설득력 있는 보고서를 통해 데이터의 잠재력을 활용하고 보다 현명한 비즈니스 의사결정을 내릴 수 있도록 지원합니다. 데이터 스튜디오에 직접 내장된 200개 이상의 커넥터에서 500개 이상의 데이터 세트에 연결할 수 있습니다. 여기에는 Google 애널리틱스, BigQuery, Sheets와 같은 Google 제품에 대한 커넥터와 외부 데이터 소스가 포함됩니다.

BigQuery란 무엇인가요?

BigQuery는 비즈니스 민첩성을 위해 설계된 Google Cloud의 완전 관리형, 확장성이 뛰어난 비용 효율적인 클라우드 데이터 웨어하우스입니다. BigQuery를 사용하면 ANSI SQL을 사용하여 엄청난 속도로 페타바이트 단위의 데이터를 분석하고, 실시간 및 예측 분석을 통해 통계를 얻고, 데이터에 액세스하고 통계를 쉽게 공유할 수 있습니다. 모두 운영 오버헤드가 없습니다.

데이터 소스 만들기

데이터 스튜디오에서 보고서를 만들기 위한 첫 단계는 보고서의 데이터 소스를 만드는 것입니다. 보고서에는 하나 이상의 데이터 소스가 포함될 수 있습니다. BigQuery 데이터 소스를 만들면 데이터 스튜디오가 BigQuery 커넥터를 사용합니다.

데이터 스튜디오 보고서에 BigQuery 데이터 소스를 추가하려면 적절한 권한이 있어야 합니다. BigQuery 데이터세트에 적용된 권한은 데이터 스튜디오에서 만드는 보고서, 차트 및 대시보드에도 적용됩니다. 데이터 스튜디오 보고서를 공유할 경우 적절한 권한이 있는 사용자에게만 보고서 구성요소가 표시됩니다.

데이터 소스를 만들려면 다음 안내를 따르세요.

  1. 데이터 스튜디오를 엽니다.
  2. 보고서 페이지의 템플릿으로 시작에서 빈 템플릿을 클릭합니다. 제목이 없는 새 보고서가 생성됩니다.

801a709b4a392db7.png

  1. 메시지가 나타나면 마케팅 환경설정계정 및 개인 정보 보호 설정을 완료하고 저장을 클릭합니다. 설정을 저장한 후 빈 템플릿을 다시 클릭해야 할 수도 있습니다.
  2. 보고서에 데이터 추가 창에서 데이터에 연결 섹션을 확인하고 BigQuery를 선택합니다.

3fb927eb5317986e.png

  1. 승인에서 승인을 클릭하여 Google 데이터 스튜디오가 GCP 프로젝트에 액세스할 수 있도록 합니다.
  2. 권한 요청 대화상자에서 허용을 클릭하여 Google 데이터 스튜디오에 BigQuery에서 데이터를 볼 수 있는 권한을 부여합니다. 이전에 Google 데이터 스튜디오를 사용한 적이 있는 경우 이 메시지가 나타나지 않을 수 있습니다.
  3. 왼쪽 탐색 메뉴에서 내 프로젝트가 기본적으로 선택되어 있습니다. 공개 데이터 세트로 선택 항목을 변경합니다.
  4. 결제 프로젝트에서 이전에 만든 GCP 프로젝트의 이름을 클릭합니다.
  5. 공개 데이터 세트에서 san_francisco_311을 클릭합니다.
  6. 표에서 311_service_requests를 클릭합니다.
  7. 창의 오른쪽 하단에서 추가를 클릭합니다. '보고서에 데이터 추가'라는 대화상자가 표시되면 '보고서에 추가'를 클릭하여 계속합니다.
  8. 데이터 스튜디오 메뉴의 리소스에서 추가된 데이터 소스 관리를 클릭합니다. c1aadb68dd5bf34f.png
  9. 데이터 소스 페이지의 311_service_requests 옆에 있는 수정을 클릭하여 테이블의 필드와 데이터 유형을 확인합니다. 이 페이지에서 필드 속성을 조정하거나 새로운 계산된 필드를 만들 수 있습니다. f0250903710fc9ed.png
  10. 이 데이터 세트에는 데이터 스튜디오에서 기본적으로 사용할 수 있는 방식으로 표현된 각 동네의 내부 지리적 포인트가 포함되어 있습니다. neighborhood_center_ds 필드 옆에서 텍스트를 클릭한 다음 지리 드롭다운 필드에서 위도, 경도를 선택하여 데이터 유형을 변경합니다. 이렇게 하면 데이터 필드가 지리적으로 표시되어야 함을 데이터 스튜디오에 알릴 수 있습니다.

1f979cf54681ae12.png

이제 BigQuery 데이터 세트가 Data Studio에 연결되었습니다.

4. 시각화 만들기

이제 BigQuery 데이터 세트 (이 경우 BigQuery 공개 데이터 세트 San Francisco 311 requests)를 성공적으로 연결했으므로 데이터를 시각화할 수 있습니다. 데이터 스튜디오에서 데이터를 기반으로 첫 번째 시각화가 자동으로 생성됩니다. 지금은 이를 삭제하여 빈 템플릿을 만들 수 있습니다.

94aea5bb5fc4ffe1.png

트리맵 만들기

먼저 트리맵을 만들어 가장 자주 접수되는 311 요청 유형을 시각화합니다. 이를 통해 집중해야 할 요청 유형을 파악하여 다른 시각화의 시작점을 정할 수 있습니다.

  1. 데이터 스튜디오 메뉴에서 차트 추가를 클릭한 다음 하단에서 트리맵을 선택합니다. 아래로 스크롤해야 할 수 있습니다.

677663906bdd050f.png 2. 데이터 스튜디오에서는 캔버스 내 영역을 클릭하거나 드래그하여 시각화를 만들 수 있습니다. 대시보드의 왼쪽 하단에 배치하는 것으로 시작합니다. 데이터 스튜디오는 포함하려는 필드를 추측하여 자동으로 트리 맵을 만듭니다.

c593d3313b5ce89.png 3. 트리맵을 클릭하여 시각화된 데이터를 변경합니다. 화면 오른쪽의 패널에서 아래 시각화와 일치하도록 매개변수를 변경합니다.

869db54f9ef19ea3.png

  1. 패널 상단에서 스타일을 클릭합니다. 이를 사용하여 트리 맵을 더 쉽게 읽을 수 있도록 약간의 변경을 적용합니다. 값이 가장 많은 요청 유형의 색상을 변경해 보겠습니다. 아래에 강조 표시된 버튼을 클릭하고 체크 표시가 있는 파란색 음영을 선택합니다. 이렇게 하면 트리맵의 텍스트와 더 나은 대비를 이룰 수 있습니다.

db4e4505d51f1539.png c04e33d3aa35e7b.png 5. 완료되면 대시보드가 다음과 같이 표시됩니다.

af147fc5a4c40d15.png

5. 대시보드 빌드

대시보드의 주요 목적 중 하나는 의사 결정을 지원하기 위해 확장 가능한 방식으로 측정항목을 쉽게 보고할 수 있도록 하는 것입니다. 이를 위해 데이터 세트의 적절한 맥락을 제공하는 데 필요한 데이터와 측정항목을 이해하기 쉬운 형식으로 포함합니다.

이 정보를 더 쉽게 이해하고 해석할 수 있도록 요소를 몇 개 추가하여 대시보드를 계속 빌드해 보겠습니다. 가장 많은 전체 요청이 있는 지역을 강조 표시하는 지도와 상위 3개 요청 유형의 총 요청 수를 알려주는 스코어카드를 추가해 보겠습니다.

대시보드에 지도 추가

  1. 메뉴에서 차트 추가를 클릭한 다음 드롭다운에서 Google 지도를 선택합니다. 지역 지도를 사용할 수도 있지만 Google 지도 시각화는 이 사용 사례에 더 적합한 컨텍스트를 제공합니다.

806f9ddfe45a242c.png 2. 트리맵과 같은 방식으로 대시보드의 오른쪽 하단에 차트를 추가합니다. 3. 대시보드에서 지도를 선택하여 매개변수를 변경합니다. 그런 다음 데이터 탭의 옵션을 아래 선택사항과 일치하도록 수정합니다. 이렇게 하려면 도움말 측정기준에 'neighborhood' 필드를 추가하고 측정항목의 풍선 크기에 'record count'를 추가합니다.

fc764cf8ec84558d.png 4. 완료되면 대시보드가 다음과 같이 표시됩니다.

59c06b3b041ff950.png

대시보드에 스코어카드 추가하기

다음으로 대시보드에 스코어카드 3개를 추가합니다. 스코어카드를 사용하면 필터링된 변수의 값을 표시할 수 있으므로 대시보드 사용자가 가장 중요한 측정항목에 집중할 수 있습니다. 필터 3개를 만든 다음 스코어카드에 적용합니다. 이렇게 하면 사용자에게 '거리 및 인도 청소', '그래피티', '노숙자 캠프' 유형의 서비스 요청 수를 보여주는 스코어카드 3개가 생성됩니다. 이는 이전에 빌드한 트리 맵에서 확인한 가장 일반적으로 요청되는 세 가지 서비스 유형입니다.

  1. 메뉴에서 차트 추가를 클릭한 다음 드롭다운에서 스코어카드를 선택합니다. 스코어카드와 축약형 숫자를 사용한 스코어카드라는 두 가지 옵션이 표시됩니다. 두 가지 모두 의도한 사용 사례에 적합합니다.

cf41ed6d758d4b3d.png 2. 대시보드의 트리 맵 위에 스코어카드를 추가하고 '레코드 수' 필드가 측정항목으로 선택되어 있는지 확인합니다. 이를 복사하여 대시보드에 간격을 두고 두 개를 더 만듭니다. d72dff7b5ada3ab3.png 3. 가장 왼쪽에 있는 스코어카드를 선택합니다. 오른쪽의 데이터 패널에서 필터 추가를 선택하고 아래 매개변수와 일치하는 필터를 만듭니다. 필터 기준을 충족하는 서비스 요청을 포함하도록 레코드 수가 필터링되도록 스코어카드가 자동으로 업데이트됩니다.

5f88670d31341a11.png 4. 중간 및 오른쪽 스코어카드에 대해서도 동일한 작업을 실행하여 '낙서' 및 '노숙자 캠프' 카테고리의 요청 수를 표시하는 스코어카드를 만듭니다. 필터 추가를 클릭하면 이미 생성된 모든 필터가 표시되는 '필터 선택기'가 표시됩니다. 하단의 필터 만들기를 클릭하여 새 필터를 만듭니다. 필터를 만든 후 스코어카드의 새 매개변수를 반영하도록 값이 자동으로 업데이트됩니다. 5. Shift 키를 누른 상태에서 스코어카드 객체 3개를 모두 선택한 다음 패널에서 스타일을 클릭하여 스코어카드의 스타일을 수정합니다. 지금 변경하면 세 가지 스코어카드 모두에 한 번에 적용됩니다. 아래 패널 설정과 일치하도록 스코어카드의 스타일을 업데이트합니다. 색상이 약간 다르더라도 걱정하지 마세요. 자체 텍스트를 대신 입력하고 대시보드 뷰어가 이러한 측정항목의 의미를 더 잘 이해할 수 있도록 '측정항목 이름 숨기기' (현재 대시보드에 '레코드 수'로 표시됨)를 선택합니다. 41e5c8035b09e55f.png 6. 사용자가 측정항목이 무엇을 나타내는지 알 수 있도록 스코어카드 위에 텍스트를 추가합니다. 툴바에서 텍스트 아이콘을 클릭합니다. 캔버스에 상자를 그린 다음 상자에 텍스트를 입력합니다.

66016180009f92f.png

대시보드는 다음과 같이 표시됩니다. 27f6ec27f3b39816.png

6. 필터 만들기

데이터 스튜디오의 필터를 사용하면 차트에 반영된 데이터를 세분화하거나 축소할 수 있습니다. SQL의 WHERE 문과 유사한 기준으로 필터를 정의합니다. 필터는 데이터세트의 하나 이상의 측정기준에 대해 특정 값 범위를 타겟팅할 수 있습니다(예: 데이터를 특정 기간으로 제한). 다양한 수준에서 필터를 적용할 수 있습니다.

  • 차트 수준: 필터가 하나의 특정 차트에만 적용됩니다.
  • 그룹 수준: 선택한 차트의 그룹에 필터가 적용됩니다.
  • 페이지 수준: 해당 페이지의 모든 차트가 필터링됩니다.
  • 보고서 수준: 보고서의 모든 차트가 필터링됩니다.

이제 대시보드의 대부분이 준비되었으므로 뷰어가 보고서 시각적 요소를 검토할 때 보고서 시각적 요소에 반영할 하나 이상의 동네를 대화형으로 선택할 수 있는 필터 컨트롤을 추가해 보겠습니다.

  1. Data Studio 메뉴에서 필터 컨트롤을 클릭합니다.

1a87123245ba52b4.png 2. 이전에 차트를 추가할 때와 마찬가지로 대시보드의 캔버스 내에서 클릭하여 필터 컨트롤을 배치합니다. 3. 필터 측정기준이 아직 설정되지 않은 경우 데이터 패널에서 '동네'로 설정되어 있는지 확인합니다. 4. 대시보드에서 필터를 클릭하여 선택합니다. 그런 다음 상단 메뉴 바에서 정렬을 클릭하고 페이지 수준으로 만들기를 선택합니다. 이 옵션을 선택할 수 없는 경우 필터가 이미 페이지 수준으로 설정되어 있으며 수정하면 해당 페이지의 모든 차트가 필터링됩니다.

이제 사용할 수 있는 적절한 대시보드가 빌드되었습니다.

7. 테스트하고 공유하기

대시보드 테스트하기

이제 대시보드가 완성되었으니 뷰어의 관점에서 살펴보고 모든 것이 예상대로 작동하는지 확인해 보겠습니다.

오른쪽 상단에 있는 보기를 클릭하면 시청자의 관점에서 대시보드를 볼 수 있습니다.

d4d3065d022ff92a.png

대시보드 공유

모든 항목이 원하는 대로 표시되면 대시보드를 공유할 수 있습니다. 데이터 스튜디오에서는 Google Sheets, Docs, 기타 G Suite 제품에서 사용되는 친숙한 공유 인터페이스를 사용하여 대시보드를 간단하게 공유할 수 있습니다.

사용자가 대시보드를 더 쉽게 찾을 수 있도록 대시보드 이름을 변경하세요. 왼쪽 상단의 보고서 이름 ('제목 없음')을 클릭하고 'San Francisco 311 Requests by Neighborhood'로 변경합니다.

오른쪽 상단의 공유 버튼을 클릭하면 이메일을 통한 개별 사용자 공유, 도메인별 공유, 모든 사용자에게 공개 등 다양한 옵션이 포함된 공유 인터페이스가 열립니다. 이 마지막 설정은 공개 웹사이트에 보고서를 삽입하려는 경우에 특히 유용합니다.

752a2679c7d6b8ec.png

다음 단계

페이지 상단에서 'Data Studio'를 검색하여 추가 코드랩 을 확인하고 Google Cloud의 비즈니스 인텔리전스 도구가 요구사항을 어떻게 지원하는지 자세히 알아보세요. Google Cloud의 최신 BI 도구인 Looker를 살펴보는 향후 Codelab을 기대해 주세요.

BigQuery BI Engine을 사용하여 최대 100GB의 메모리 내 스토리지를 활용하여 대시보드의 속도를 높일 수도 있습니다. BI Engine은 빠른 속도를 구현하는 메모리 내 분석 서비스로, 사용자가 1초 미만의 쿼리 응답 시간과 높은 동시성으로 BigQuery 내에서 복잡한 데이터 세트를 양방향으로 탐색할 수 있도록 지원합니다. 데이터 스튜디오와 원활하게 통합되어 데이터 탐색 및 분석을 가속화하므로 시청자를 위한 대시보드가 더욱 강력해집니다.