Laboratório Pentaho para Windows
Laboratório Pentaho
O Pentaho Data Integration é uma ferramenta baseada em cliente comumente instalada e configurada para rodar no Windows 11.
Existem várias opções de licenciamento; para estes workshops vamos instalar a Edição Enterprise. Isso lhe dará a oportunidade de testar a construção de uma solução completa - pipelines de dados automatizados + análises ..

Os passos a seguir destinam-se a configurar um ambiente de Laboratório Pentaho e precisam ser concluídos para finalizar os Workshops.
Certifique-se de ter baixado o Workshop--Installation
Docker Desktop
O Docker Desktop é um aplicativo para Windows, macOS e Linux que fornece uma interface fácil de usar para desenvolver e executar aplicações conteinerizadas. Ele agrupa o Docker Engine, Docker CLI, Docker Compose, Kubernetes e outras ferramentas essenciais em um único pacote com interface gráfica.
O Docker Desktop simplifica o gerenciamento de containers ao lidar automaticamente com a virtualização subjacente, permitindo que desenvolvedores construam, testem e implantem aplicações em containers isolados e portáteis sem se preocupar com diferenças de configuração de ambiente. É particularmente popular entre desenvolvedores que desejam garantir que suas aplicações executem consistentemente em diferentes ambientes, desde máquinas de desenvolvimento locais até servidores de produção.
Baixe o instalador do Docker Desktop.
Navegue para: Downloads
Clique duas vezes:
Docker Desktop Installer.exepara executar o instalador.
Por padrão, o Docker Desktop é instalado em C:\Program Files\Docker\Docker.
Quando solicitado, certifique-se de que a Use WSL 2 em vez do Hyper-V opção na página de Configuração esteja selecionada.
Em sistemas que suportam apenas um backend, o Docker Desktop seleciona automaticamente a opção disponível.

Feche para completar o processo de instalação.
Usuário do Docker
Se sua conta de administrador for diferente da sua conta de usuário, você deve adicionar o usuário ao grupo docker-users:
Execute Gerenciamento do Computador como administrador.
Navegue até Usuários e Grupos Locais > Grupos > docker-users.
Clique com o botão direito para adicionar o usuário ao grupo.

Saia e entre novamente para que as alterações entrem em vigor.
Docker Compose - MySQL
O usuário pentaho_admin possui apenas permissão de LEITURA para o banco de dados Steel Wheels - sampledata. A conta de administrador foi removida.
Como você irá executar operações CRUD no banco de dados, precisamos implantar um banco de dados sampledata - container Docker, concedendo todos os privilégios a um usuário admin.
Execute o script a seguir para criar uma pasta MySQL e copiar os arquivos necessários.
Verifique se o diretório foi criado e os arquivos copiados.
Execute o script docker-compose para criar o container.

Verifique se o container está ativo e em execução no Docker Desktop.


sampledata_schema.sql
Este script cria uma estrutura de banco de dados relacional abrangente para uma aplicação de exemplo de negócios. Ele foi projetado para modelar um sistema de vendas e gerenciamento de pedidos para uma empresa que vende vários produtos.
Configuração do Banco de Dados
Cria um banco de dados chamado
com conjunto de caracteres UTF-8
Configura usuários com permissões apropriadas
Configura o modo SQL para melhor integridade dos dados
Tabelas
ESCRITÓRIOS: Armazena locais de escritórios da empresa com detalhes de endereço
FUNCIONÁRIOS: Contém informações de funcionários com relacionamentos a escritórios e estrutura de report
CLIENTES: Armazena informações de clientes incluindo detalhes de contato e limites de crédito
PRODUTOS: Contém catálogo de produtos com informações de estoque e preços
PEDIDOS: Rastreia pedidos de clientes com status e datas
DETALHES_PEDIDO: Contém itens por pedido com quantidade e preço
PAGAMENTOS: Registra pagamentos de clientes com valores e datas
FATO_PEDIDO: Uma tabela fato para análises de pedidos
CLIENTE_COM_TERR: Informações estendidas do cliente com território
DIM_TEMPO: Tabela dimensão de tempo para relatórios
GERENTES_DEPARTAMENTO: Armazena informações de gerentes de departamento
QUADRANT_ACTUALS: Contém dados financeiros orçamento vs. real com uma coluna VARIANCE gerada
BALANÇO_DE_TESTE: Dados contábeis financeiros
Visões
resumo_pedidos_cliente: Resume pedidos e gastos por cliente
desempenho_produto: Analisa métricas de vendas de produtos incluindo receita e lucro
desempenho_vendas_funcionario: Rastreia desempenho de vendas por funcionário
tendencia_vendas_mensal: Mostra tendências de vendas ao longo do tempo por mês
status_estoque_produto: Categoriza produtos por níveis de estoque
historico_pagamentos_cliente: Resume atividade de pagamentos e saldos de clientes
Procedures Armazenadas
ObterPedidosDoCliente: Recupera pedidos de um cliente específico
AtualizarEstoqueProduto: Atualiza níveis de inventário do produto
ObterVendasProdutoPorTrimestre: Analisa vendas de produtos por trimestre
ObterMelhoresClientesPorRegiao: Identifica os melhores clientes por região
ObterValorEstoquePorLinhaDeProduto: Calcula métricas de inventário por linha de produto
Triggers
antes_insercao_pedido: Valida restrições de data em pedidos
antes_insercao_pagamento: Garante que os valores de pagamento sejam positivos
Execute o seguinte comando para criar o esquema.
Este comando está importando o esquema SQL para um banco de dados MySQL em execução em um container Docker. Aqui está uma descrição:
Este comando lê o arquivo SQL:
Encaminha (pipe) o conteúdo do arquivo para o próximo comando:
Isto executa um comando em um container Docker em execução:
Você pode verificar o banco de dados sampledata e as tabelas com os seguintes comandos.
Mostrar bancos de dados:
Mostrar tabelas:
Mostrar colunas da tabela:

sampledata_data.sql
Este script popula o banco de dados com dados de exemplo para demonstrar a funcionalidade do esquema.
Dados de Referência
Locais de escritórios em diferentes regiões
Hierarquia de funcionários com cargos
Catálogo de produtos organizado por linhas de produto
Dados Transacionais
Registros de clientes com informações de contato
Histórico de pedidos com datas e status
Detalhes do pedido com quantidades e preços
Registros de pagamentos
Características dos Dados
Cenários de negócios realistas com status de pedidos variados
Catálogo de produtos abrangente com descrições e preços
Estrutura hierárquica de funcionários com relações de reporte
Dados baseados em tempo abrangendo vários anos para análise de tendências
Dados financeiros adequados para orçamento e análise de variância
Recursos Notáveis
Os dados seguem restrições de integridade referencial
Tratamento adequado de valores NULL quando apropriado
Valores realistas de preço e quantidade
Colunas geradas (como VARIANCE) são excluídas de inserções diretas
Os pedidos são sequenciados para satisfazer restrições de chave estrangeira
Execute o seguinte comando para carregar os dados nas tabelas sampledata.
Você pode usar os seguintes comandos para verificar se os dados foram carregados.
Para contar o número de linhas em uma tabela específica:
Para ver as primeiras linhas de uma tabela:
Para verificar contagens de todas as tabelas:
Para obter um resumo das tabelas e seus status:

DBeaver
Você vai precisar de uma ferramenta de gerenciamento de banco de dados. O DBeaver Community é uma ferramenta gratuita e de código aberto para gerenciamento de bancos de dados em projetos pessoais.
Vá para o oficial página de download do DBeaver
Navegue até Downloads e clique duas vezes em:
dbeaver-ce-25.2.5-x86_64-setup.exeSiga as instruções de instalação.
Siga as instruções na tela, clicando em "Next" e concordando com o contrato de licença para prosseguir.
Escolha as opções de instalação desejadas (por exemplo, para todos os usuários ou para o usuário atual).

Complete o processo de instalação.
Banco de Dados MySQL
Se você completou os 3 requisitos anteriores, então deverá ter um container MySQL Docker, exposto na porta:3306 com o banco de dados sampledata.
Inicie o DBeaver e selecione: MySQL.

Configure a conexão com as seguintes propriedades:
Nome de usuário: root ou pentaho_user
Senha: password

Pode ser necessário baixar a versão suportada do driver do banco de dados.
Também habilite: allowPublicKeyRetrieval

Teste a conexão.

Expanda: databases > sampledata > Tables

Abra uma janela SQL e execute uma query de teste.

Atualizado
Isto foi útil?
