1. Introdução
O BigQuery é um data warehouse sem servidor, altamente escalonável e econômico. Basta mover seus dados para o BigQuery, e ele fará todo o trabalho pesado para que você possa se concentrar no que realmente importa: administrar sua empresa. Controle o acesso ao projeto e aos dados de acordo com a necessidade dos negócios, por exemplo, definindo quem tem permissão para visualizar ou consultar os dados.
Neste laboratório, você vai descobrir as possibilidades analíticas do BigQuery. Você vai aprender a importar um conjunto de dados de um bucket do Cloud Storage e entender a interface do BigQuery trabalhando com um conjunto de dados de banco de varejo. Além disso, este laboratório vai ensinar você a descobrir recursos importantes do BigQuery que facilitam muito sua análise diária, como exportar resultados de consultas em uma planilha, ver e executar consultas do histórico, conferir o desempenho das consultas e criar visualizações de tabelas para serem usadas por outras equipes e departamentos.
O que você vai aprender
Neste laboratório, você aprenderá a fazer o seguinte:
- Como carregar novos dados no BigQuery
- Conheça a interface do BigQuery
- Executar consultas no BigQuery
- Conferir a performance da consulta
- Como criar visualizações no BigQuery
- Compartilhar conjuntos de dados com outras pessoas de forma segura
2. Introdução: noções básicas sobre a interface do BigQuery
Nesta seção, você vai aprender a navegar pela interface do BigQuery, ver os conjuntos de dados disponíveis e executar uma consulta simples.
Carregando a interface do BigQuery
- Digite "BigQuery" na parte de cima do console do Google Cloud Platform.
- Selecione BigQuery na lista de opções. Selecione a opção com o logotipo do BigQuery, a lupa.
Como visualizar conjuntos de dados e executar consultas

- No painel esquerdo da seção "Recursos", clique no seu projeto do BigQuery.
- Clique em
bq_demopara ver as tabelas no conjunto de dados. - Na caixa de pesquisa, digite "card" para ver uma lista de tabelas e conjuntos de dados que contêm "card" no nome.
- Selecione a tabela "card_transactions" na lista de resultados da pesquisa.

- Clique na guia "Detalhes" no painel
card_transactionspara ver os metadados dessa tabela. - Clique na guia "Visualização" para conferir uma prévia da tabela.
[Argumento competitivo ]: a integração com o Google Data Catalog significa que os metadados do BigQuery podem ser gerenciados com outras fontes de dados, como data lakes ou fontes de dados operacionais. Este é um exemplo que mostra que o Google Cloud não é apenas um data warehouse relacional, mas uma plataforma completa de dados analíticos.
- Clique no ícone de lupa para consultar a tabela "card_transactions". Um texto gerado automaticamente vai preencher o editor de consultas do BigQuery.
- Insira o código abaixo para mostrar comerciantes distintos da tabela "Card_Transactions"
SELECT distinct (merchant) FROM bq_demo.card_transactions LIMIT 1000
- Clique no botão "Executar" para processar a consulta.

3. Como criar conjuntos de dados e compartilhar visualizações
O compartilhamento de dados e a governança são cruciais e podem ser feitos de maneira intuitiva na interface do BigQuery. Nesta seção, você vai aprender a criar um conjunto de dados, preenchê-lo com uma visualização e compartilhar esse conjunto.
Como acessar o histórico de consultas
- Clique em "Histórico de consultas" no painel esquerdo do Console do GCP.
- Clique em "Atualizar" no painel "Histórico de consultas".
- Clique na imagem/seta de download no canto direito da consulta para ver os resultados.

Como criar um conjunto de dados
- Selecione [nome do projeto] no painel de recursos da interface do BigQuery.
- Selecione "Criar novo conjunto de dados" no painel de informações do projeto.
- Para o ID do conjunto de dados:
bq_demo_shared
- Mantenha os valores padrão em todos os outros campos.
- Clique em "Criar conjunto de dados".

Como criar visualizações
[Ponto de discussão competitiva ]: o BigQuery é totalmente compatível com ANSI SQL e oferece suporte a junções simples e complexas de várias tabelas, além de funções analíticas avançadas. Lançamos continuamente suporte aprimorado para tipos de dados e funções SQL comuns usados em data warehouses tradicionais para facilitar o processo de migração.
- Selecione "Escrever nova consulta" na parte de cima do painel do Editor de consultas.
- Insira o código a seguir no editor de consultas:
WITH revenue_by_month AS (
SELECT
card.type AS card_type,
FORMAT_DATE('%Y-%m', trans_date) as revenue_date,
SUM(amount) as revenue
FROM bq_demo.card_transactions
JOIN bq_demo.card ON card_transactions.cc_number = card.card_number
WHERE trans_date DATE_ADD(CURRENT_DATE, INTERVAL -1 YEAR)
GROUP BY card_type, revenue_date
)
SELECT
card_type,
revenue_date,
revenue as monthly_rev,
revenue - LAG(revenue) OVER (ORDER BY card_type, revenue_date ASC) as rev_change
FROM revenue_by_month
ORDER BY card_type, revenue_date ASC;
- Clique em "Salvar visualização".
- Selecione o projeto atual em "Nome do projeto".
- Selecione o conjunto de dados recém-criado:
bq_demo_shared
- Para "Nome da tabela":
rev_change_by_card_type
- Clique em "Salvar".

Como compartilhar visualizações e conjuntos de dados
- Selecione o conjunto de dados "bq_demo_shared" no painel de recursos à esquerda na interface do BigQuery.
- Clique em "Compartilhar conjunto de dados" no painel de informações do conjunto de dados.
- Insira um endereço de e-mail
- Selecione "Leitor de dados do BigQuery" no menu suspenso "Papel".
- Clique em "Adicionar"
- Clique em Concluído

Análise de dados no Planilhas Google
[Ponto de discussão competitiva ]: Outro benefício do BigQuery em comparação com os concorrentes é o BI Engine. O BI Engine pode ser usado para fazer com que consultas de resumo do tipo BI retornem em menos de um segundo usando o mecanismo de cache na memória. Atualmente, isso é compatível com o Google Data Studio, mas em breve estará disponível para acelerar todas as consultas no BigQuery.
Por exemplo:
O Snowflake depende de ferramentas de BI de terceiros para painéis e visualização de dados, enquanto o GCP oferece uma variedade de ferramentas de BI integradas, incluindo Páginas Google conectadas, Data Studio e Looker.
- Selecione a visualização "rev_change_by_card_type" no painel de recursos à esquerda na interface do BigQuery.
- Clique na lupa para consultar a visualização

- Tipo:
SELECT *
FROM bq_demo_shared.rev_change_by_card_type
- Clique em "Executar".
- Clique no ícone "Exportar" no painel de resultados.
- Selecione "Analisar dados com as Planilhas".

- Clique em"Começar a análise".
- Selecione "Tabela dinâmica".
- Selecione "Nova planilha".
- Clique em "Criar".
- Adicione "revenue_date" na seção "Linha" do editor de tabela dinâmica, que fica à direita da janela do Google Sheets.
- Adicione "card_type" na seção "Coluna" do editor de tabelas dinâmicas.
- Adicione "monthly_rev" na seção "Coluna" do editor da tabela dinâmica.
- Clique em "Aplicar"

- Navegue até a parte de cima da interface das Planilhas e selecione "Inserir" > "Gráfico".
4. Configuração: integração de dados
Nesta seção, você vai aprender a criar uma tabela e realizar uma junção em um dos vários conjuntos de dados públicos disponíveis no Google Cloud.
[Competitive Talking Point]:
O BigQuery oferece suporte a conjuntos de dados compartilhados há anos. Os clientes em qualquer projeto podem consultar conjuntos de dados públicos e conjuntos de dados em outros projetos que foram compartilhados com eles.
O BigQuery pode oferecer suporte a data lakes no GCS usando tabelas externas. Além do carregamento em massa, o BigQuery oferece suporte à capacidade de transmitir dados para o banco de dados a taxas de centenas de MB por segundo. O Snowflake não oferece suporte a dados de streaming.
Importar dados para uma nova tabela
- No painel de recursos, selecione o conjunto de dados bq_demo.
- No painel de informações do conjunto de dados, selecione "Criar tabela".
- Selecionar o Google Cloud Storage como origem
- Na caixa de texto do caminho do arquivo:
gs://retail-banking-looker/district
- Selecione CSV em "Formato de arquivo"
- Insira "district" em "Nome da tabela"
- Marque a caixa de seleção "Detectar esquema automaticamente".
- Clique em "Criar tabela".
Consultar um conjunto de dados público
- No editor de consultas, insira a seguinte consulta:
SELECT
CAST(geo_id as STRING) AS zip_code,
total_pop,
median_age,
households,
income_per_capita,
housing_units,
vacant_housing_units_for_sale,
ROUND(SAFE_DIVIDE(employed_pop, pop_16_over),4) AS rate_employment,
ROUND(SAFE_DIVIDE(bachelors_degree_or_higher_25_64, pop_25_64),4) AS rate_bachelors_degree_or_higher_25_64
FROM
`bigquery-public-data.census_bureau_acs.zip_codes_2017_5yr`;
- Clique em "Executar".
- Ver os resultados

- Agora vamos combinar esses dados públicos com outra consulta. Insira o seguinte código SQL no editor de consultas:
WITH customer_counts AS (
select regexp_extract(address, "[0-9][0-9][0-9][0-9][0-9]") as zip_code,
count(*) as num_clients
FROM bq_demo.client
GROUP BY zip_code
)
SELECT
CAST(geo_id as STRING) AS zip_code,
total_pop,
median_age,
households,
income_per_capita,
ROUND(SAFE_DIVIDE(employed_pop, pop_16_over),4) AS rate_employment,
num_clients
FROM
`bigquery-public-data.census_bureau_acs.zip_codes_2017_5yr`
JOIN customer_counts on zip_code = geo_id
ORDER BY num_clients DESC
- Clique em "Executar".
- Ver os resultados

5. Gerenciamento de capacidade
Como trabalhar com slots e reservas
O BQ oferece vários modelos de preços para atender às suas necessidades. A maioria dos grandes clientes usa principalmente a taxa fixa para preços previsíveis com capacidade reservada. Para exceder essa capacidade básica, o BQ oferece slots flexíveis, que permitem aumentar a capacidade adicional rapidamente e depois reduzir automaticamente sem afetar as consultas em execução. O BQ também tem um modelo de verificação de bytes que permite pagar apenas pelas consultas executadas.
[Argumento competitivo : alguns concorrentes trabalham exclusivamente em um modelo de capacidade fixa em que os clientes precisam alocar um data warehouse virtual para cada carga de trabalho na organização. Além de um modelo de baixo custo por consulta que facilita o início com o BigQuery, oferecemos suporte a um modelo de preços de capacidade de taxa fixa em que a capacidade ociosa pode ser compartilhada entre um conjunto de cargas de trabalho.]
- Acesse a guia "Reservas".

- Clique em "Comprar slots".

- Selecione "Flex" como duração.
- Selecione 500 slots.
- Confirme a compra.

- Clique em "Ver compromissos de slot".
- Clique em "Criar reserva".
- Usuário "demo" como nome da reserva
- Selecione Estados Unidos como local
- Digite 500 para slots (todos disponíveis)
- Clique em "Atribuições"
- Escolher o projeto atual para o projeto da organização
- Selecione "demo" para o ID da reserva.
- Clique em "Criar".