Laboratorio Pentaho en Windows
Laboratorio Pentaho
Pentaho Data Integration es una herramienta basada en cliente comúnmente instalada y configurada para ejecutarse en Windows 11.
Hay varias opciones de licencia; para estos talleres instalaremos una Edición Enterprise. Esto te dará la oportunidad de probar la construcción de una solución completa: canalizaciones de datos automatizadas + análisis ..

Los pasos siguientes están pensados para configurar un entorno de Laboratorio Pentaho y deben completarse para terminar los talleres.
Asegúrate de haber descargado Workshop--Installation
Docker Desktop
Docker Desktop es una aplicación para Windows, macOS y Linux que proporciona una interfaz fácil de usar para desarrollar y ejecutar aplicaciones en contenedores. Agrupa el Docker Engine, Docker CLI, Docker Compose, Kubernetes y otras herramientas esenciales en un único paquete con interfaz gráfica.
Docker Desktop simplifica la gestión de contenedores al manejar automáticamente la virtualización subyacente, permitiendo a los desarrolladores construir, probar y desplegar aplicaciones en contenedores aislados y portátiles sin preocuparse por diferencias en la configuración del entorno. Es particularmente popular entre desarrolladores que desean asegurar que sus aplicaciones funcionen de forma consistente en diferentes entornos, desde máquinas de desarrollo locales hasta servidores de producción.
Descarga el instalador de Docker Desktop.
Navega a: Descargas
Haz doble clic:
Docker Desktop Installer.exepara ejecutar el instalador.
Por defecto, Docker Desktop se instala en C:\Program Files\Docker\Docker.
Cuando se te pida, asegúrate de que la Usar WSL 2 en lugar de Hyper-V opción en la página de Configuración esté seleccionada.
En sistemas que solo soportan un backend, Docker Desktop selecciona automáticamente la opción disponible.

Cerrar para completar el proceso de instalación.
Usuario de Docker
Si tu cuenta de administrador es diferente a tu cuenta de usuario, debes añadir al usuario al grupo docker-users:
Ejecuta Administración del equipo como administrador.
Navega a Usuarios y grupos locales > Grupos > docker-users.
Haz clic derecho para añadir el usuario al grupo.

Cierra sesión y vuelve a iniciar sesión para que los cambios surtan efecto.
Docker Compose - MySQL
El usuario pentaho_admin solo tiene permiso de LECTURA para la base de datos Steel Wheels - sampledata. La cuenta de administrador ha sido eliminada.
Como vas a ejecutar operaciones CRUD en la base de datos, necesitamos desplegar una base de datos sampledata en un contenedor Docker, otorgando todos los privilegios a un usuario administrador.
Ejecuta el siguiente script para crear una carpeta MySQL y copiar los archivos requeridos.
Comprueba que el directorio se ha creado y que los archivos se han copiado.
Ejecuta el script docker-compose para crear el contenedor.

Comprueba que el contenedor esté activo y en ejecución en Docker Desktop.


sampledata_schema.sql
Este script crea una estructura de base de datos relacional completa para una aplicación empresarial de ejemplo. Está diseñado para modelar un sistema de ventas y gestión de pedidos para una empresa que vende varios productos.
Configuración de la base de datos
Crea una base de datos llamada
con conjunto de caracteres UTF-8
Configura usuarios con permisos apropiados
Configura el modo SQL para mejorar la integridad de los datos
Tablas
OFICINAS: Almacena ubicaciones de oficinas de la empresa con detalles de dirección
EMPLEADOS: Contiene información de empleados con relaciones a oficinas y estructura de reportes
CLIENTES: Almacena información de clientes incluyendo datos de contacto y límites de crédito
PRODUCTOS: Contiene el catálogo de productos con información de inventario y precios
PEDIDOS: Registra pedidos de clientes con estado y fechas
DETALLES_PEDIDO: Contiene las líneas de cada pedido con cantidad y precio
PAGOS: Registra los pagos de clientes con importes y fechas
HECHO_PEDIDO: Una tabla de hechos para análisis de pedidos
CLIENTE_CON_TER: Información ampliada del cliente con territorio
DIM_TIEMPO: Tabla de dimensión temporal para informes
GERENTES_DEPARTAMENTO: Almacena información de los gerentes de departamento
CUADRANTE_REALES: Contiene datos financieros de presupuesto vs. real con una columna VARIANCE generada
BALANCE_DE_COMPROBACION: Datos de contabilidad financiera
Vistas
resumen_pedidos_cliente: Resume pedidos y gastos por cliente
rendimiento_producto: Analiza métricas de ventas de productos incluyendo ingresos y beneficio
rendimiento_ventas_empleado: Rastrea el rendimiento de ventas por empleado
tendencia_ventas_mensual: Muestra tendencias de ventas a lo largo del tiempo por mes
estado_inventario_producto: Categoriza productos por niveles de inventario
historial_pagos_cliente: Resume la actividad de pagos de clientes y saldos
Procedimientos almacenados
ObtenerPedidosCliente: Recupera pedidos para un cliente específico
ActualizarStockProducto: Actualiza los niveles de inventario de productos
ObtenerVentasProductoPorTrimestre: Analiza las ventas trimestrales de productos
ObtenerMejoresClientesPorRegion: Identifica los mejores clientes por región
ObtenerValorInventarioPorLineaProducto: Calcula métricas de inventario por línea de producto
Disparadores
antes_insercion_pedido: Valida restricciones de fecha en los pedidos
antes_insercion_pago: Asegura que los importes de pago sean positivos
Ejecuta el siguiente comando para crear el esquema.
Este comando está importando datos de esquema SQL en una base de datos MySQL que se ejecuta en un contenedor Docker. Aquí hay un desglose:
Este comando lee el archivo SQL:
Hace una tubería (reenvía) el contenido del archivo al siguiente comando:
Esto ejecuta un comando en un contenedor Docker en ejecución:
Puedes comprobar la base de datos sampledata y las tablas con los siguientes comandos.
Mostrar bases de datos:
Mostrar tablas:
Mostrar columnas de una tabla:

sampledata_data.sql
Este script popula la base de datos con datos de ejemplo para demostrar la funcionalidad del esquema.
Datos de referencia
Ubicaciones de oficinas en diferentes regiones
Jerarquía de empleados con títulos de trabajo
Catálogo de productos organizado por líneas de producto
Datos transaccionales
Registros de clientes con información de contacto
Historial de pedidos con fechas y estado
Detalles de pedidos con cantidades y precios
Registros de pagos
Datos financieros
Cifras de presupuesto vs. real en CUADRANTE_REALES
Datos contables de balance de comprobación
Características de los datos
Escenarios empresariales realistas con distintos estados de pedidos
Catálogo de productos completo con descripciones y precios
Estructura jerárquica de empleados con relaciones de reporte
Datos basados en el tiempo que abarcan múltiples años para análisis de tendencias
Datos financieros adecuados para presupuestación y análisis de variaciones
Características destacadas
Los datos siguen restricciones de integridad referencial
Manejo adecuado de valores NULL donde corresponda
Valores realistas de precios y cantidades
Las columnas generadas (como VARIANCE) están excluidas de inserciones directas
Los pedidos están secuenciados para satisfacer las restricciones de claves foráneas
Ejecuta el siguiente comando para cargar los datos en las tablas sampledata.
Puedes usar los siguientes comandos para verificar que los datos se hayan cargado.
Para contar el número de filas en una tabla específica:
Para ver las primeras filas de una tabla:
Para comprobar recuentos de todas las tablas:
Para obtener un resumen de las tablas y sus estados:

DBeaver
Vas a necesitar una herramienta de gestión de bases de datos. DBeaver Community es una herramienta de gestión de bases de datos gratuita y de código abierto para proyectos personales.
Ve al oficial página de descarga de DBeaver
Navega a Descargas y haz doble clic en:
dbeaver-ce-25.2.5-x86_64-setup.exeSigue las instrucciones de instalación.
Sigue las instrucciones en pantalla, haciendo clic en "Siguiente" y aceptando el acuerdo de licencia para continuar.
Elige las opciones de instalación deseadas (por ejemplo, para todos los usuarios o el usuario actual).

Completa el proceso de instalación.
Base de datos MySQL
Si has completado los 3 requisitos anteriores, entonces deberías tener un contenedor MySQL en Docker, expuesto en el puerto:3306 con la base de datos sampledata.
Lanza DBeaver y selecciona: MySQL.

Configura la conexión con las siguientes propiedades:
Nombre de usuario: root o pentaho_user
Contraseña: password

Puede que necesites descargar la versión compatible del controlador de la base de datos.
También habilita: allowPublicKeyRetrieval

Prueba la conexión.

Expande: databases > sampledata > Tables

Abre una ventana SQL y ejecuta una consulta de prueba.

Última actualización
¿Te fue útil?
