Esse é um template para um pacote DBT a ser importado no repositório principal, que irá gerar um servidor RPC para execução dos projetos.
- Faça um fork desse repositório (docs).
- Modifique o nome do repositório, caso deseje.
- Configure os seguintes secrets no repositório:
GKE_PROJECT: identificador do projeto no GCP.GKE_CLUSTER_NAME: nome do cluster no GKE.GKE_CLUSTER_ZONE: zona do cluster no GKE.GKE_SA_KEY: credenciais para uma conta de serviço com pleno acesso ao GKE, GCR e GCS. Preencher com o resultado decat sua-credencial.json | base64.
- Modifique o nome do pacote em
dbt_project.ymlpara o nome do seu projeto. Aproveite esse momento para ler, com calma, os comentários desse arquivo de configuração. - Crie contas de serviço para seus projetos de desenvolvimento e produção. Caso tenha somente um projeto, pode usar a mesma conta para ambos os propósitos. Nota: Jamais faça commit de suas credenciais.
- Acesse o arquivo
profiles.ymle se atente aos comentários, eles indicam os campos que devem ser alterados. - Usando os arquivos de credencial, crie os secrets
credentials-devecredentials-produsando a flag--from-file. - Faça o upload das alterações realizadas em seu repositório.
- Toda vez que houver uma alteração de código na branch
master, uma instância atualizada do servidor RPC do DBT será criada em seu cluster, no devido namespace.
- Learn more about dbt in the docs
- Check out Discourse for commonly asked questions and answers
- Join the chat on Slack for live discussions and support
- Find dbt events near you
- Check out the blog for the latest news on dbt's development and best practices
-
Caso seja um
dataset-idjá existente, acessemodels/<dataset-id>e pule para o passo 5. -
Caso seja um novo
dataset-id, crie um novo diretóriomodels/<dataset-id>. -
No arquivo
dbt_project.ymlregistre odataset-idjunto aos já existentes, conforme exemplo abaixo:
models:
emd:
dataset-id:
+materialized: view # Materialization type (view, table or incremental)
+schema: dataset-id # Overrides the default schema (defaults to what is set on profiles.yml)- No diretório
models/<dataset-id>, crie um arquivoschema.ymlpara preencher metadados de suas tabelas. Exemplo abaixo:
version: 2
models:
- name: my_first_dbt_model
description: "A starter dbt model"
columns:
- name: id
description: "The primary key for this table"- Desenvolva seus modelos (que corresponderão a tabelas) no diretório
models/<dataset-id>.