Laboratoire Pentaho Ubuntu
Configurer le serveur Pentaho + plugins sur Ubuntu ..
Laboratoire Pentaho
Pentaho Data Integration est un outil côté client couramment installé et configuré pour fonctionner sous Windows 11.
Il existe plusieurs options de licence ; pour ces ateliers nous installerons une édition Enterprise. Cela vous donnera l'occasion d'essayer de construire une solution complète - pipelines de données automatisés + analyses ..

Les étapes suivantes sont destinées à configurer un environnement Laboratoire Pentaho et doivent être complétées afin de terminer les ateliers.
Assurez-vous d'avoir téléchargé l'atelier--Installation :
Pour installer git :
Prérequis
Système Ubuntu 24.04 LTS (machine physique ou virtuelle)
Compte utilisateur avec privilèges sudo
Connexion Internet
Connaissances de base de la ligne de commande Linux
Docker
Docker est une plateforme qui permet aux développeurs d'emballer des applications et leurs dépendances dans des conteneurs légers et portables. Les conteneurs garantissent que les applications s'exécutent de manière cohérente dans différents environnements informatiques, des ordinateurs portables de développement aux serveurs de production. Cet atelier vous guidera à travers le processus complet d'installation de Docker Engine sur Ubuntu 24.04 LTS (Noble Numbat).
Avant d'installer Docker, mettez à jour votre liste de paquets existante.
Installez les paquets qui permettent à apt d'utiliser les dépôts via HTTPS.
Créez un répertoire pour les keyrings et ajoutez la clé GPG de Docker.
Ajoutez le dépôt Docker à vos sources apt.
Maintenant que le dépôt Docker est ajouté, mettez à jour l'index des paquets.
Installez Docker Engine, containerd et Docker Compose.
Vérifiez que Docker est correctement installé en vérifiant la version.
Vous devriez voir une sortie similaire à (nov. 2025) :
Vérifiez que Docker Engine fonctionne.
Le service devrait s'afficher comme « active (running) ».
Quitter.
Testez votre installation Docker en exécutant le conteneur hello-world.
Cette commande télécharge une image de test et l'exécute dans un conteneur. Si elle réussit, vous verrez un message confirmant que Docker fonctionne correctement.
Sans sudo
Par défaut, Docker nécessite des privilèges sudo. Pour exécuter des commandes Docker sans sudo.
Ajoutez votre utilisateur au groupe docker.
Appliquez la nouvelle appartenance au groupe (ou déconnectez-vous puis reconnectez-vous).
Vérifiez que vous pouvez exécuter Docker sans sudo.
Assurez-vous que Docker démarre automatiquement au démarrage du système.
Vérification et tests
Pour confirmer que tout fonctionne correctement, exécutez les commandes suivantes :
Vérifier la version de Docker :
Afficher les informations système de Docker :
Lister les conteneurs en cours d'exécution :
Lister tous les conteneurs (y compris ceux arrêtés) :
Lister les images téléchargées :
Commandes courantes
Voici les commandes Docker essentielles que vous utiliserez régulièrement :
docker pull <image>- Télécharger une image depuis Docker Hubdocker images- Lister toutes les images localesdocker run <image>- Créer et démarrer un conteneur à partir d'une imagedocker ps- Lister les conteneurs en cours d'exécutiondocker ps -a- Lister tous les conteneursdocker stop <container>- Arrêter un conteneur en cours d'exécutiondocker rm <container>- Supprimer un conteneur arrêtédocker rmi <image>- Supprimer une imagedocker logs <container>- Voir les journaux du conteneurdocker exec -it <container> bash- Accéder au shell d'un conteneur en cours d'exécution
Docker Compose - MySQL
L'utilisateur pentaho_admin n'a que l'autorisation LECTURE pour la base de données Steel Wheels - sampledata. Le compte administrateur a été supprimé.
Comme vous allez effectuer des opérations CRUD sur la base de données, nous devons déployer une base de données sampledata - conteneur Docker, en accordant tous les privilèges à un utilisateur admin.
Exécutez le script suivant pour créer un dossier MySQL et copier les fichiers requis.
Vérifiez que le répertoire a été créé et que les fichiers ont été copiés.
Exécutez le script docker-compose pour créer le conteneur.

Vérifiez que le conteneur est démarré et en cours d'exécution dans Docker.


sampledata_schema.sql
Ce script crée une structure de base de données relationnelle complète pour une application métier d'exemple. Il est conçu pour modéliser un système de gestion des ventes et des commandes pour une entreprise qui vend divers produits.
Configuration de la base de données
Crée une base de données nommée
avec l'encodage de caractères UTF-8
Met en place des utilisateurs avec les permissions appropriées
Configure le mode SQL pour une meilleure intégrité des données
Tables
BUREAUX: Stocke les emplacements des bureaux de l'entreprise avec les détails d'adresse
EMPLOYÉS: Contient des informations sur les employés avec des relations aux bureaux et à la structure hiérarchique
CLIENTS: Stocke les informations client incluant les coordonnées et les limites de crédit
PRODUITS: Contient le catalogue de produits avec les informations d'inventaire et de tarification
COMMANDES: Suit les commandes des clients avec le statut et les dates
DETAILS_COMMANDE: Contient les lignes d'articles pour chaque commande avec quantité et prix
PAIEMENTS: Enregistre les paiements des clients avec montants et dates
FACT_COMMANDE: Une table de faits pour l'analyse des commandes
CLIENT_AVEC_TER: Informations client étendues avec territoire
DIM_TEMPS: Table dimensionnelle de temps pour les rapports
RESPONSABLES_DEPARTEMENT: Stocke les informations des responsables de département
QUADRANT_REELS: Contient les données financières budget vs réel avec une colonne VARIANCE générée
BALANCE_DE_VERSEMENT: Données de comptabilité financière
Vues
résumé_commandes_client: Résume les commandes et les dépenses par client
performance_produit: Analyse les métriques de ventes des produits incluant revenus et bénéfices
performance_ventes_employé: Suit la performance des ventes par employé
tendance_ventes_mensuelle: Montre les tendances des ventes dans le temps par mois
statut_inventaire_produit: Catégorise les produits par niveaux d'inventaire
historique_paiements_client: Résume l'activité de paiement des clients et les soldes
Procédures stockées
ObtenirCommandesClient: Récupère les commandes d'un client spécifique
MettreAJourStockProduit: Met à jour les niveaux d'inventaire des produits
ObtenirVentesProduitParTrimestre: Analyse les ventes trimestrielles par produit
ObtenirTopClientsParRégion: Identifie les meilleurs clients par région
ObtenirValeurInventaireParLigneProduit: Calcule les métriques d'inventaire par ligne de produit
Triggers
avant_insertion_commande: Valide les contraintes de date sur les commandes
avant_insertion_paiement: S'assure que les montants des paiements sont positifs
Exécutez la commande suivante pour créer le schéma.
Cette commande importe des données de schéma SQL dans une base de données MySQL s'exécutant dans un conteneur Docker. Voici une répartition :
Cette commande lit le fichier SQL :
Transmet (redirige) le contenu du fichier à la commande suivante :
Ceci exécute une commande dans un conteneur Docker en cours d'exécution :
Vous pouvez vérifier la base de données sampledata et les tables avec les commandes suivantes.
Afficher les bases de données :
Afficher les tables :
Afficher les colonnes d'une table :
sampledata_data.sql
Ce script peuple la base de données avec des données d'exemple pour démontrer la fonctionnalité du schéma.
Données de référence
Emplacements des bureaux à travers différentes régions
Hiérarchie des employés avec intitulés de postes
Catalogue de produits organisé par lignes de produits
Données transactionnelles
Enregistrements clients avec informations de contact
Historique des commandes avec dates et statuts
Détails des commandes avec quantités et prix
Enregistrements de paiements
Données financières
Chiffres budget vs réel dans QUADRANT_REELS
Données de comptabilité de balance de vérification
Caractéristiques des données
Scénarios commerciaux réalistes avec divers statuts de commande
Catalogue de produits complet avec descriptions et tarification
Structure hiérarchique des employés avec relations de reporting
Données temporelles couvrant plusieurs années pour l'analyse des tendances
Données financières adaptées à la budgétisation et à l'analyse des écarts
Caractéristiques notables
Les données respectent les contraintes d'intégrité référentielle
Bonne gestion des valeurs NULL lorsque c'est approprié
Valeurs de prix et de quantités réalistes
Les colonnes générées (comme VARIANCE) sont exclues des insertions directes
Les commandes sont séquencées pour satisfaire les contraintes de clé étrangère
Exécutez la commande suivante pour charger les données dans les tables sampledata.
Vous pouvez utiliser les commandes suivantes pour vérifier que les données ont été chargées.
Pour compter le nombre de lignes dans une table spécifique :
Pour voir les premières lignes d'une table :
Pour vérifier les comptes pour toutes les tables :
Pour obtenir un résumé des tables et de leur statut :

DBeaver
Vous allez avoir besoin d'un outil de gestion de base de données. DBeaver Community est un outil de gestion de base de données gratuit et open-source pour les projets personnels.
L'option la plus simple est de télécharger et d'installer depuis le Snapstore.
Ou
Allez sur le site officiel page de téléchargement de DBeaver
Ou
Pour installer ce fichier DEB.
Épingler DBeaver au lanceur - barre d'outils inférieure.
Base de données MySQL
Si vous avez rempli les 3 exigences précédentes, vous devriez avoir un conteneur MySQL Docker, exposé sur le port :3306 avec la base de données sampledata.
Lancez DBeaver et sélectionnez : MySQL.

Configurez la connexion avec les propriétés suivantes :
Nom d'utilisateur : root ou pentaho_user
Mot de passe : password

Vous devrez peut-être télécharger la version du pilote de base de données prise en charge.
Activez également : allowPublicKeyRetrieval

Testez la connexion.

Développez : bases de données > sampledata > Tables

Ouvrez une fenêtre SQL et exécutez une requête de test.

Dépannage général (cliquer pour développer)
Problème : erreurs « permission denied »
Solution : Assurez-vous que votre utilisateur fait partie du groupe docker et que vous vous êtes déconnecté/reconnecté ou avez exécuté
newgrp docker
Problème : le service Docker ne démarre pas
Solution : Vérifiez les journaux avec
sudo journalctl -u docker.service
Problème : Impossible de se connecter au démon Docker
Solution : Assurez-vous que le service Docker fonctionne avec
sudo systemctl start docker
Mis à jour
Ce contenu vous a-t-il été utile ?
