Laboratorio Pentaho en Windows
Laboratorio Pentaho
Pentaho Data Integration es una herramienta basada en cliente comúnmente instalada y configurada para ejecutarse en Windows 11.
Existen varias opciones de licencia; para estos talleres instalaremos una Edición Empresarial. Esto te dará la oportunidad de probar la construcción de una solución completa: canalizaciones de datos automatizadas + analítica ..

Los siguientes pasos están destinados a configurar un entorno de Laboratorio Pentaho y deben completarse para finalizar los talleres.
Asegúrate de haber descargado Workshop--Installation
Docker Desktop
Docker Desktop es una aplicación para Windows, macOS y Linux que proporciona una interfaz fácil de usar para desarrollar y ejecutar aplicaciones en contenedores. Agrupa el Docker Engine, Docker CLI, Docker Compose, Kubernetes y otras herramientas esenciales en un solo paquete con una interfaz gráfica de usuario.
Docker Desktop simplifica la gestión de contenedores al manejar automáticamente la virtualización subyacente, permitiendo a los desarrolladores construir, probar y desplegar aplicaciones en contenedores aislados y portátiles sin preocuparse por las diferencias de configuración del entorno. Es particularmente popular entre desarrolladores que quieren garantizar que sus aplicaciones se ejecuten de forma coherente en distintos entornos, desde máquinas de desarrollo locales hasta servidores de producción.
Descarga el instalador de Docker Desktop.
Navega a: Descargas
Haz doble clic:
Docker Desktop Installer.exepara ejecutar el instalador.
Por defecto, Docker Desktop se instala en C:\Program Files\Docker\Docker.
Cuando se te solicite, asegúrate de que la Usar WSL 2 en lugar de Hyper-V opción en la página de Configuración esté seleccionada.
En sistemas que solo admiten un backend, Docker Desktop selecciona automáticamente la opción disponible.

Cerrar para completar el proceso de instalación.
Usuario de Docker
Si tu cuenta de administrador es diferente a tu cuenta de usuario, debes agregar el usuario al grupo docker-users:
Ejecuta Administración de equipos como administrador.
Navega a Usuarios y grupos locales > Grupos > docker-users.
Haz clic derecho para agregar el usuario al grupo.

Cierra la sesión y vuelve a iniciarla para que los cambios surtan efecto.
Docker Compose - MySQL
El usuario pentaho_admin solo tiene permiso de LECTURA para la base de datos Steel Wheels - sampledata. La cuenta de administrador ha sido eliminada.
Como vas a realizar operaciones CRUD en la base de datos, necesitamos desplegar una base de datos sampledata en un contenedor Docker, otorgando todos los privilegios a un usuario administrador.
Ejecuta el siguiente script para crear una carpeta MySQL y copiar los archivos necesarios.
Verifica que el directorio se haya creado y que los archivos se hayan copiado.
Ejecuta el script docker-compose para crear el contenedor.

Comprueba que el contenedor esté activo y en funcionamiento en Docker Desktop.


sampledata_schema.sql
Este script crea una estructura de base de datos relacional completa para una aplicación de negocio de ejemplo. Está diseñado para modelar un sistema de ventas y gestión de pedidos para una empresa que vende varios productos.
Configuración de la base de datos
Crea una base de datos llamada
con conjunto de caracteres UTF-8
Configura usuarios con permisos apropiados
Configura el modo SQL para una mejor integridad de los datos
Tablas
OFICINAS: Almacena ubicaciones de oficinas de la empresa con detalles de la dirección
EMPLEADOS: Contiene información de empleados con relaciones a oficinas y estructura de reportes
CLIENTES: Almacena información de clientes incluyendo detalles de contacto y límites de crédito
PRODUCTOS: Contiene el catálogo de productos con inventario e información de precios
PEDIDOS: Rastrea pedidos de clientes con estado y fechas
DETALLES_PEDIDO: Contiene las líneas de cada pedido con cantidad y precio
PAGOS: Registra pagos de clientes con montos y fechas
FACT_PEDIDO: Una tabla de hechos para analítica de pedidos
CLIENTE_CON_TER: Información extendida del cliente con territorio
DIM_TIEMPO: Tabla dimensión tiempo para informes
GERENTES_DEPARTAMENTO: Almacena información de gerentes de departamento
CUADRANTE_REALES: Contiene datos financieros de presupuesto vs. reales con una columna VARIANCE generada
BALANCE_DE_COMPROBACIÓN: Datos contables financieros
Vistas
resumen_pedidos_cliente: Resume pedidos y gastos por cliente
rendimiento_producto: Analiza métricas de ventas de productos incluyendo ingresos y beneficio
rendimiento_ventas_empleado: Rastrea el rendimiento de ventas por empleado
tendencia_ventas_mensual: Muestra tendencias de ventas a lo largo del tiempo por mes
estado_inventario_producto: Categoriza productos por niveles de inventario
historial_pagos_cliente: Resume la actividad de pagos y saldos de clientes
Procedimientos almacenados
ObtenerPedidosCliente: Recupera pedidos para un cliente específico
ActualizarStockProducto: Actualiza los niveles de inventario de productos
ObtenerVentasProductoPorTrimestre: Analiza las ventas de productos por trimestre
ObtenerMejoresClientesPorRegión: Identifica los mejores clientes por región
ObtenerValorInventarioPorLíneaProducto: Calcula métricas de inventario por línea de producto
Disparadores
antes_insertar_pedido: Valida restricciones de fecha en pedidos
antes_insertar_pago: Asegura que los montos de pago sean positivos
Ejecuta el siguiente comando para crear el esquema.
Este comando está importando datos del esquema SQL a una base de datos MySQL que se ejecuta en un contenedor Docker. Aquí hay un desglose:
Este comando lee el archivo SQL:
Envía (redirige) el contenido del archivo al siguiente comando:
Esto ejecuta un comando en un contenedor Docker en ejecución:
Puedes comprobar la base de datos sampledata y las tablas con los siguientes comandos.
Mostrar bases de datos:
Mostrar tablas:
Mostrar columnas de la tabla:

sampledata_data.sql
Este script pobla la base de datos con datos de ejemplo para demostrar la funcionalidad del esquema.
Datos de referencia
Ubicaciones de oficinas en diferentes regiones
Jerarquía de empleados con cargos
Catálogo de productos organizado por líneas de producto
Datos transaccionales
Registros de clientes con información de contacto
Historial de pedidos con fechas y estado
Detalles de pedidos con cantidades y precios
Registros de pagos
Datos financieros
Cifras de presupuesto vs. reales en CUADRANTE_REALES
Datos contables de balance de comprobación
Características de los datos
Escenarios comerciales realistas con estados de pedidos variados
Catálogo de productos completo con descripciones y precios
Estructura jerárquica de empleados con relaciones de reporte
Datos basados en el tiempo que abarcan varios años para análisis de tendencias
Datos financieros adecuados para presupuestos y análisis de variaciones
Características notables
Los datos siguen restricciones de integridad referencial
Manejo adecuado de valores NULL cuando corresponde
Precios y cantidades realistas
Las columnas generadas (como VARIANCE) están excluidas de inserciones directas
Los pedidos están secuenciados para satisfacer las restricciones de claves foráneas
Ejecuta el siguiente comando para cargar los datos en las tablas sampledata.
Puedes usar los siguientes comandos para comprobar que los datos se han cargado.
Para contar el número de filas en una tabla específica:
Para ver las primeras filas de una tabla:
Para comprobar los conteos de todas las tablas:
Para obtener un resumen de las tablas y sus estados:

DBeaver
Vas a necesitar una herramienta de gestión de bases de datos. DBeaver Community es una herramienta gratuita y de código abierto para la gestión de bases de datos para proyectos personales.
Ve al oficial página de descarga de DBeaver
Navega a Descargas y haz doble clic en:
dbeaver-ce-25.2.5-x86_64-setup.exeSigue las instrucciones de instalación.
Sigue las instrucciones en pantalla, haciendo clic en "Siguiente" y aceptando el acuerdo de licencia para continuar.
Elige las opciones de instalación deseadas (por ejemplo, para todos los usuarios o el usuario actual).

Completa el proceso de instalación.
Base de datos MySQL
Si has completado los 3 requisitos anteriores, deberías tener un contenedor MySQL en Docker, expuesto en el puerto:3306 con la base de datos sampledata.
Inicia DBeaver y selecciona: MySQL.

Configura la conexión con las siguientes propiedades:
Nombre de usuario: root o pentaho_user
Contraseña: password

Puede que necesites descargar la versión compatible del driver de la base de datos.
También habilita: allowPublicKeyRetrieval

Prueba la conexión.

Expande: databases > sampledata > Tables

Abre una ventana SQL y ejecuta una consulta de prueba.

Última actualización
¿Te fue útil?
