Laboratorio Pentaho en Ubuntu
Configurar Pentaho Server + complementos en Ubuntu ..
Laboratorio Pentaho
Pentaho Data Integration es una herramienta basada en cliente comúnmente instalada y configurada para ejecutarse en Windows 11.
Hay varias opciones de licencia; para estos talleres instalaremos una Edición Enterprise. Esto te dará la oportunidad de probar la construcción de una solución completa: canalizaciones de datos automatizadas + análisis ..

Los pasos siguientes están destinados a configurar un entorno de Laboratorio Pentaho y deben completarse para finalizar los Talleres.
Asegúrate de haber descargado Workshop--Installation:
Para instalar git:
Prerequisitos
Sistema Ubuntu 24.04 LTS (máquina física o virtual)
Cuenta de usuario con privilegios sudo
Conexión a Internet
Familiaridad básica con la línea de comandos de Linux
Docker
Docker es una plataforma que permite a los desarrolladores empaquetar aplicaciones y sus dependencias en contenedores livianos y portátiles. Los contenedores garantizan que las aplicaciones se ejecuten de forma consistente en diferentes entornos informáticos, desde portátiles de desarrollo hasta servidores de producción. Este taller te guiará a través del proceso completo de instalación de Docker Engine en Ubuntu 24.04 LTS (Noble Numbat).
Antes de instalar Docker, actualiza la lista de paquetes existente.
Instala paquetes que permiten a apt usar repositorios mediante HTTPS.
Crea un directorio para keyrings y añade la clave GPG de Docker.
Agrega el repositorio de Docker a tus fuentes de apt.
Ahora que se ha agregado el repositorio de Docker, actualiza el índice de paquetes.
Instala Docker Engine, containerd y Docker Compose.
Verifica que Docker esté instalado correctamente comprobando la versión.
Deberías ver una salida similar a (Nov 2025):
Verifica que Docker Engine esté en ejecución.
El servicio debería mostrarse como "active (running)".
Salir.
Prueba tu instalación de Docker ejecutando el contenedor hello-world.
Este comando descarga una imagen de prueba y la ejecuta en un contenedor. Si tiene éxito, verás un mensaje que confirma que Docker funciona correctamente.
Añade tu usuario al grupo docker.
Aplica la nueva membresía de grupo (o cierra sesión y vuelve a iniciar).
Verifica que puedes ejecutar Docker sin sudo.
Asegúrate de que Docker se inicie automáticamente cuando el sistema arranque.
Verificación y pruebas
Para confirmar que todo funciona correctamente, ejecuta los siguientes comandos:
Comprobar versión de Docker:
Ver información del sistema Docker:
Listar contenedores en ejecución:
Listar todos los contenedores (incluidos los detenidos):
Listar imágenes descargadas:
Comandos comunes
Aquí están los comandos esenciales de Docker que usarás regularmente:
docker pull <image>- Descargar una imagen desde Docker Hubdocker images- Listar todas las imágenes localesdocker run <image>- Crear y arrancar un contenedor desde una imagendocker ps- Listar contenedores en ejecucióndocker ps -a- Listar todos los contenedoresdocker stop <container>- Detener un contenedor en ejecucióndocker rm <container>- Eliminar un contenedor detenidodocker rmi <image>- Eliminar una imagendocker logs <container>- Ver los registros del contenedordocker exec -it <container> bash- Acceder al shell de un contenedor en ejecución
Docker Compose - MySQL
El usuario pentaho_admin sólo tiene permiso de LECTURA para la base de datos Steel Wheels - sampledata. La cuenta de administrador ha sido eliminada.
Como vas a realizar operaciones CRUD en la base de datos, necesitamos desplegar una base de datos sampledata en un contenedor Docker, otorgando todos los privilegios a un usuario administrador.
Ejecuta el siguiente script para crear una carpeta MySQL y copiar los archivos requeridos.
Comprueba que el directorio se ha creado y que los archivos se han copiado.
Ejecuta el script docker-compose para crear el contenedor.

Comprueba que el contenedor está activo y en ejecución en Docker.


sampledata_schema.sql
Este script crea una estructura de base de datos relacional completa para una aplicación empresarial de ejemplo. Está diseñado para modelar un sistema de ventas y gestión de pedidos para una empresa que vende varios productos.
Configuración de la base de datos
Crea una base de datos llamada
con conjunto de caracteres UTF-8
Configura usuarios con los permisos apropiados
Configura el modo SQL para una mejor integridad de datos
Tablas
OFICINAS: Almacena las ubicaciones de las oficinas de la empresa con detalles de dirección
EMPLEADOS: Contiene información de empleados con relaciones a oficinas y estructura de reportes
CLIENTES: Almacena información de clientes incluyendo detalles de contacto y límites de crédito
PRODUCTOS: Contiene el catálogo de productos con información de inventario y precios
PEDIDOS: Rastrea los pedidos de clientes con estado y fechas
DETALLESPEDIDO: Contiene las partidas de cada pedido con cantidad y precio
PAGOS: Registra los pagos de clientes con importes y fechas
FACT_PEDIDOS: Una tabla de hechos para análisis de pedidos
CLIENTE_CON_TER: Información ampliada del cliente con territorio
DIM_TIEMPO: Tabla de dimensión de tiempo para informes
GERENTES_DEPARTAMENTO: Almacena información de gerentes de departamento
CUADRANTE_REALES: Contiene datos financieros de presupuesto vs. reales con una columna VARIANCE generada
BALANCE_DE_COMPROBACIÓN: Datos de contabilidad financiera
Vistas
resumen_pedidos_cliente: Resume pedidos y gasto por cliente
rendimiento_producto: Analiza métricas de ventas de productos incluyendo ingresos y beneficio
rendimiento_ventas_empleado: Rastrea el desempeño de ventas por empleado
tendencia_ventas_mensual: Muestra tendencias de ventas a lo largo del tiempo por mes
estado_inventario_producto: Categoriza productos por niveles de inventario
historial_pagos_cliente: Resume la actividad de pagos y saldos de clientes
Procedimientos almacenados
GetCustomerOrders: Recupera pedidos de un cliente específico
UpdateProductStock: Actualiza niveles de inventario de productos
GetProductSalesByQuarter: Analiza ventas trimestrales de productos
GetTopCustomersByRegion: Identifica los mejores clientes por región
GetInventoryValueByProductLine: Calcula métricas de inventario por línea de producto
Disparadores
before_order_insert: Valida restricciones de fecha en los pedidos
before_payment_insert: Asegura que los importes de pago sean positivos
Ejecuta el siguiente comando para crear el esquema.
Este comando está importando datos del esquema SQL en una base de datos MySQL que se ejecuta en un contenedor Docker. Aquí hay un desglose:
Este comando lee el archivo SQL:
Pasa (redirige) el contenido del archivo al siguiente comando:
Esto ejecuta un comando en un contenedor Docker en ejecución:
Puedes comprobar la base de datos sampledata y las tablas con los siguientes comandos.
Mostrar bases de datos:
Mostrar tablas:
Mostrar columnas de una tabla:
sampledata_data.sql
Este script llena la base de datos con datos de ejemplo para demostrar la funcionalidad del esquema.
Datos de referencia
Ubicaciones de oficinas en diferentes regiones
Jerarquía de empleados con títulos de trabajo
Catálogo de productos organizado por líneas de producto
Datos transaccionales
Registros de clientes con información de contacto
Historial de pedidos con fechas y estado
Detalles de pedidos con cantidades y precios
Registros de pagos
Datos financieros
Cifras de presupuesto vs. reales en CUADRANTE_REALES
Datos contables de balance de comprobación
Características de los datos
Escenarios empresariales realistas con estados de pedido variados
Catálogo de productos completo con descripciones y precios
Estructura jerárquica de empleados con relaciones de dependencia
Datos basados en el tiempo que abarcan múltiples años para análisis de tendencias
Datos financieros adecuados para presupuestación y análisis de variaciones
Características notables
Los datos siguen restricciones de integridad referencial
Manejo correcto de valores NULL cuando procede
Precios y cantidades realistas
Las columnas generadas (como VARIANCE) están excluidas de inserciones directas
Los pedidos están secuenciados para satisfacer las restricciones de claves externas
Ejecuta el siguiente comando para cargar los datos en las tablas sampledata.
Puedes usar los siguientes comandos para comprobar que los datos se han cargado.
Para contar el número de filas en una tabla específica:
Para ver las primeras filas de una tabla:
Para comprobar recuentos de todas las tablas:
Para obtener un resumen de las tablas y sus estados:

DBeaver
Vas a necesitar una herramienta de gestión de bases de datos. DBeaver Community es una herramienta gratuita y de código abierto para la gestión de bases de datos en proyectos personales.
La opción más simple es descargar e instalar desde Snapstore.
O
Ve al oficial Página de descarga de DBeaver
O
Para instalar ese archivo DEB.
Fija DBeaver en el Dash - barra de herramientas inferior.
Base de datos MySQL
Si has completado los 3 requisitos anteriores, deberías tener un contenedor MySQL en Docker, expuesto en el puerto:3306 con la base de datos sampledata.
Inicia DBeaver y selecciona: MySQL.

Configura la conexión con las siguientes propiedades:
Nombre de usuario: root o pentaho_user
Contraseña: password

Puede que necesites descargar la versión del controlador de base de datos compatible.
También habilita: allowPublicKeyRetrieval

Prueba la conexión.

Expandir: bases de datos > sampledata > Tables

Abre una ventana SQL y ejecuta una consulta de prueba.

Solución general de problemas (haz clic para expandir)
Problema: errores "permission denied"
Solución: Asegúrate de que tu usuario esté en el grupo docker y que hayas cerrado sesión/iniciado sesión o hayas ejecutado
newgrp docker
Problema: El servicio Docker no arranca
Solución: Comprueba los registros con
sudo journalctl -u docker.service
Problema: No se puede conectar al daemon de Docker
Solución: Asegúrate de que el servicio Docker esté en ejecución con
sudo systemctl start docker
Última actualización
¿Te fue útil?
