SteelWheels
Descripción de un esquema Mondrian v3 ..
Taller - Visión general del esquema SteelWheels
Mientras que las bases de datos relacionales sobresalen en almacenar datos transaccionales, analizar esos datos a través de múltiples dimensiones —como ventas por producto, por región, por período de tiempo— requiere un enfoque diferente. OLAP (Procesamiento Analítico en Línea) permite el análisis multidimensional organizando los datos en cubos con dimensiones, jerarquías y medidas. Schema Workbench de Pentaho te permite crear esquemas Mondrian que mapear tus estructuras de base de datos relacionales en potentes cubos OLAP, transformando datos en filas y columnas en modelos analíticos intuitivos y orientados al negocio.
En este taller guiado de demostración, explorarás el esquema Mondrian SteelWheels: un ejemplo completo construido sobre la base de datos SampleData que representa un escenario típico de análisis de ventas. Usando tanto JDBC Explorer como Schema Workbench, examinarás cómo los datos transaccionales de ventas se transforman en un cubo multidimensional con jerarquías geográficas, dimensiones de cliente, categorizaciones de productos y análisis temporal. Esta exploración práctica proporciona la base que necesitas para entender los conceptos de modelado dimensional antes de construir tus propios esquemas.
Lo que lograrás:
Configurar conexiones JDBC en Schema Workbench para acceder a bases de datos relacionales
Usar JDBC Explorer para navegar tablas físicas de la base de datos, columnas y relaciones
Abrir y examinar un esquema Mondrian existente (SteelWheels.xml)
Explorar la estructura del cubo Sales_2003_2005 y su tabla de hechos ORDERFACT
Examinar la dimensión Markets con su jerarquía geográfica de cuatro niveles
Revisar la dimensión Customers incluyendo propiedades de miembros para atributos enriquecidos
Entender las dimensiones Products y Time para análisis por producto y temporal
Identificar dimensiones degeneradas como Order Status que existen dentro de las tablas de hechos
Explorar medidas incluyendo Quantity y Sales con sus agregadores y cadenas de formato
Revisar anotaciones que proporcionan funcionalidad mejorada y metadatos
Al final de este taller, comprenderás los componentes esenciales que comprenden un esquema Mondrian y cómo trabajan juntos para habilitar el análisis multidimensional. Verás cómo las tablas de hechos contienen transacciones medibles, cómo las tablas de dimensiones proporcionan contexto a través de jerarquías y cómo estos elementos se combinan para crear cubos OLAP intuitivos. Esta base conceptual —obtenida explorando un ejemplo completo y del mundo real— te prepara para diseñar y construir tus propios esquemas que transformen datos relacionales en potentes modelos analíticos para Pentaho Analyzer y otras herramientas de informes OLAP.
Prerrequisitos: Schema Workbench instalado y configurado; Pentaho Server en ejecución con la base de datos SampleData accesible; comprensión básica de conceptos de bases de datos relacionales y principios de modelado dimensional
Tiempo estimado: 45 minutos

Iniciar Schema Workbench:
Asegurarse de que Pentaho Server esté en ejecución:
Asegúrate de que el Pentaho Server esté activo y en ejecución (se inicia automáticamente en Pentaho Lab):
Sigue la guía a continuación para entender cómo se define un Esquema:
Conexión JDBC
Antes de crear cualquier componente del esquema, debes configurar una conexión a la base de datos seleccionando Opciones > Conexión desde el menú y proporcionando parámetros esenciales de conexión incluyendo el nombre de la conexión, el tipo de base de datos (como Hypersonic, MySQL, Oracle o PostgreSQL), el método de acceso (JDBC nativo), el nombre del host, el nombre de la base de datos, el número de puerto y las credenciales de autenticación.
Schema Workbench admite una amplia gama de bases de datos relacionales mediante controladores JDBC, lo que te permite conectarte a la mayoría de los sistemas de bases de datos comunes.
Si estás usando el Pentaho Lab entonces el controlador ya ha sido copiado al directorio /lib.
Para crear una conexión JDBC necesitarás copiar el controlador JDBC para tu base de datos en el directorio de instalación de PSW ...\schema-workbench\lib.
Reinicia Pentaho Schema Workbench para registrar el controlador.
Para conectarte a la base de datos sampledata, en el menú selecciona Opciones > Conexión.

En el cuadro de diálogo Conexión de base de datos, escribe o elige lo siguiente:
Nombre de la conexión
hsqldb_sampledata (no puedes usar caracteres reservados en el nombre de la conexión)
Tipo de conexión
Hypersonic
Nombre del host
localhost
Nombre de la base de datos
sampledata
Número de puerto
9001
Nombre de usuario
pentaho_admin
Contraseña
password
Haz clic en Probar.

Haz clic en Aceptar para descartar el cuadro de diálogo del Mensaje y haz clic en Aceptar para cerrar el cuadro de diálogo Conexión de base de datos.
Para ver la base de datos SampleData en JDBC Explorer, en el menú selecciona Archivo > Nuevo > JDBC Explorer.

Para ver las tablas físicas, expande PUBLIC.
Para ver las columnas en la tabla CUSTOMER_W_TER, expande CUSTOMER_W_TER.

Para cerrar JDBC Explorer, en la esquina superior derecha de la ventana JDBC Explorer, haz clic en el icono X.
Esquema Steel Wheels
El SteelWheels esquema es un esquema de análisis Mondrian completo construido sobre la base de datos SampleData que demuestra el modelado dimensional a nivel empresarial para análisis de ventas. El esquema se centra en el cubo Sales_2003_2005 que usa la tabla de hechos ORDERFACT que contiene datos transaccionales de ventas que abarcan tres años.
Presenta cinco dimensiones bien diseñadas:
Markets dimensión con una jerarquía geográfica de cuatro niveles (Territorio, País, Estado/Provincia, Ciudad) para análisis basado en ubicación;
Customers dimensión con detalles a nivel de cliente y seis propiedades de miembros que proporcionan atributos enriquecidos del cliente;
Products dimensión para categorización y análisis de productos;
Time dimensión que permite el análisis temporal a través de años, trimestres y meses;
Order Status dimensión, que sirve como ejemplo de una dimensión degenerada que existe dentro de la tabla de hechos sin una tabla de dimensión separada.
El esquema incluye múltiples medidas tales como Quantity y Sales con agregadores adecuados y cadenas de formato, lo que lo convierte en un modelo de referencia ideal para entender cómo los complejos requisitos de negocio se traducen en cubos OLAP funcionales que soportan informes y análisis interactivos en Pentaho Analyzer.
En el menú, selecciona Archivo > Abrir.
Navega a: Workshop--Busines-Analytics\PSW\schemas\.

Selecciona: SteelWheels.xml.
Haz clic: Abrir.
Para ver el esquema, en el panel izquierdo, expande Sales_2003_2005.

Observa la tabla de hechos, las dimensiones y las medidas.
Para ver la tabla de hechos, en el panel izquierdo, haz clic en Tabla: ORDERFACT.
En el panel izquierdo, expande Markets.

La dimensión Markets consiste en una jerarquía con cuatro niveles con la tabla CUSTOMER_W_TER.
Para ver las anotaciones del nivel Country, en el panel izquierdo, expande Markets y haz clic en Data.Role.

En el panel izquierdo, expande Customers.

La dimensión Customers consiste en una jerarquía con un nivel (Customer) y seis propiedades de miembro.
Ver la dimensión Product
Expande la dimensión Time.
Las dimensiones de fecha son de las dimensiones más importantes de muchos cubos Mondrian. La utilidad de un cubo a menudo depende de la forma en que se ha modelado la dimensión de fecha. Esta sección muestra cómo crear una dimensión de fecha básica y cómo puede aumentarse con propiedades para adaptarse a necesidades de análisis específicas.
Las dimensiones de tiempo basadas en: año/trimestre/mes/semana/día están codificadas de manera diferente en el esquema debido a las funciones relacionadas con el tiempo de MDX.
Las dimensiones de tiempo se identifican con type=TimeDimension. El papel de un nivel en una dimensión de tiempo se indica con el atributo levelType:
TimeYears
TimeQuarters
TimeMonths
TimeWeeks
TimeDays

En el panel izquierdo, expande Order Status.

Mientras que una dimensión en estrella tiene una tabla de dimensión, y una dimensión copo de nieve tiene dos o más, una dimensión degenerada no tiene ninguna. Todas las columnas que describen la dimensión viven en la tabla de hechos.
Por ejemplo, se podría crear una dimensión degenerada para Order Status porque solo hay pocos valores en la columna Order Status. Crear una tabla de dimensión es innecesario porque tiene solo unos pocos valores, no agrega información adicional y supone el costo de una unión adicional.
Para ver la medida Quantity, en el panel izquierdo, haz clic en Quantity.

Observa el agregador, la columna y el formatString.
(Opcional) Ver la medida Sales.
Para cerrar el esquema, en la esquina superior derecha de la ventana del esquema, haz clic en el icono X.
Última actualización
¿Te fue útil?
