diamonds-4Composants

Présentation des composants de Pentaho Enterprise ..

circle-info

Architecture client/serveur de Pentaho

L'architecture client/serveur de Pentaho constitue la base de sa suite d'intégration de données et d'analytique métier, offrant une plateforme flexible et évolutive pour la gestion et l'analyse des données en entreprise. L'architecture est conçue pour prendre en charge divers besoins d'intégration de données, de reporting et d'analytique au sein d'une organisation.

Architecture Pentaho
Numéro de port
Description

5432

Serveur PostgreSQL

8080

Port de démarrage du serveur Web Tomcat du serveur Pentaho

8012

Port d'arrêt du serveur Pentaho

9001

Port du serveur HSQL

9092

Base de données H2 embarquée

Les composants clés incluent :

circle-info

Outils client Pentaho

Le client Pentaho, composant clé de la suite Pentaho, englobe plusieurs outils destinés aux utilisateurs pour la gestion des données et l'analytique. Ils comprennent l'outil d'intégration de données (PDI), central pour les opérations d'extraction, transformation et chargement (ETL) ; Spoon, une interface graphique pour concevoir les processus ETL ; Designer pour la conception pratique de pipelines ; Scheduler lié à Quartz pour la planification des tâches ; Repository Browser pour la gestion des ressources ETL ; et Database Explorer pour les opérations sur les bases de données.

De plus, il propose des outils tels que Metadata Editor et Schema Workbench pour la manipulation avancée des données. Ensemble, ces outils permettent aux utilisateurs de traiter et d'analyser efficacement les données au sein de l'écosystème Pentaho.

circle-info

Intégration de données

Pentaho Data Integration (PDI), également connu sous le nom de Kettle, est un outil open-source d'intégration de données qui permet l'extraction, la transformation et le chargement (ETL) des données dans des bases de données, des entrepôts de données et des applications métiers. Il est conçu pour gérer une grande variété de sources de données, y compris les bases de données relationnelles traditionnelles, les formats de données non structurées et le stockage cloud. PDI est composé de plusieurs composants clés qui travaillent ensemble pour fournir une solution ETL complète.

Architecture client/serveur de Pentaho
circle-info

Spoon

Spoon est l'interface graphique (GUI) pour la conception et le test des jobs et des transformations PDI. Il permet aux utilisateurs de créer, modifier et gérer visuellement les processus ETL sans écrire de code.

Designer

Glisser-déposer d'« objets » pour concevoir vos pipelines et flux de travail.

Scheduler

Se connecte au planificateur Quartz sur le serveur. Les jobs et transformations doivent être téléchargés dans le dépôt (Repository).

Repository Browser

Le dépôt est une zone de stockage centrale pour les ressources PDI telles que les jobs, transformations et connexions de base de données. Il facilite la collaboration entre les membres de l'équipe en leur permettant de partager et de gérer efficacement les actifs ETL.

Ces composants font collectivement de PDI un outil puissant pour l'intégration de données, permettant aux entreprises de nettoyer, intégrer et analyser des données provenant de sources diverses de manière plus efficace.

Se connecte au repository de contenu Apache Jackrabbit, pointant vers une base de données prise en charge :

  • PostgreSQL

  • Serveur MSSQL

  • Oracle

  • MySQL

  • MariaDB

DB Explorer

Explorateur de base de données qui vous permet d'effectuer des opérations minimales sur la base de données.

Mis à jour

Ce contenu vous a-t-il été utile ?