Pour savoir où on va, il faut savoir d'où l'on vient

Vous avez
une question ?
Un projet ?

Contactez nous !
 

Contactez-nous

Vous avez une question ? un projet ? 
Vous souhaitez plus d'informations sur un produit ? sur notre offre ? 
Contactez-nous, on vous répond sous 4H.

retour

Talend

Talend

Présentation

Talend Open Studio est un ETL open source, développé par la société Talend, basée en France.

Talend est un ETL de type « générateur de code », c’est-à-dire qu’il permet de créer graphiquement des processus de manipulation et de transformation de données puis de générer l’exécutable correspondant sous forme de programme Java ou Perl. Ce programme Java ou Perl doit être déployé sur le serveur d’exécution.

Talend est l’ETL utilisé par les solutions SpagoBI et JasperSoft (où il est renommé en JasperETL).

Au moment où nous écrivons ces lignes, Talend Open Studio est disponible dans sa version 4.1.2.

Définition de processus

Les processus de manipulation de données sont créés en utilisant un modèle graphique à base de glisser/déposer. De nombreux types d’étapes sont disponibles pour se connecter aux principales bases de données ainsi que pour traiter différents types de fichiers (CSV, Excel, XML).

Talend dispose de fonctionnalités inédites pour un ETL open source :

  • les étapes ELT (Extract Load Transform), qui tirent parti de la base de données cible pour les différentes opérations, ce qui améliore grandement les performances au prix de possibilités plus limitées.
  • des connecteurs pour certaines applications de CRM (SugarCRM, SalesForce et CentricCRM ), ce qui évite de manipuler les modèles relationnels de ces outils.
  • possibilité d’ajouter simplement de nouvelles fonctions et composants afin de réaliser des processus plus complexes, de développer des connecteurs supplémentaires.

On notera que Talend facilite la construction des requêtes sur les bases de données en détectant les relations entre tables grâce aux clés étrangères et en proposant une interface « à la Access ».

Talend processus
Talend affectation modification des valeurs

Modèles métier

Talend permet également de créer un modèle métier (Business Model) afin de modéliser les interactions entre les différents systèmes et bases de données. Les informations de connexion, les métadonnées ainsi que des documents peuvent être associés à chaque élément. Le modèle constitue alors une véritable documentation du système d’information.

Talend modèle métier

Ce mode est désormais complété avec un générateur de documentation technique permettant aux développeurs de gagner du temps dans l’étape souvent oubliée des spécifications techniques.

Gestion des contextes

Talend permet de gérer les contextes et de les appliquer aux transformations. Le même processus peut donc s’exécuter en environnement de développement, de test ou de production, avec à chaque fois l’utilisation des bonnes connexions aux bases de données et les bonnes métadonnées.

Déploiement des processus

Une fois le programme généré, celui-ci est installé par un administrateur sur la machine cible et son exécution est planifiée en utilisant le service cron d’Unix ou les tâches planifiées de Windows selon le cas.

Avec la version TIS (Talend Integration Suite), est proposée une fonction « Distant Run » et « CPU Balancer » permettant à Talend de parfaitement s’intégrer dans des environnements professionnels industrialisés.

A travers la console de supervision en mode client Java ou en mode Web, les personnes chargées de l’exploitation des interfaces disposent de tableaux de bord synthétisant la bonne ou mauvaise exécution des traitements.

Conclusion

Talend Open Studio est un produit complet. Talend a noué des partenariats avec de nombreuses sociétés éditrices de solutions décisionnelles ou de bases de données, ce qui renforce sa position sur le marché.

En 2010, Talend a complété son offre avec un nouvel outil « Talend MDM ». Ce nouvel outil vient compléter l'offre de l'éditeur avec un module permettant de construire et maintenir des référentiels. Son offre s'articule donc aujourd'hui autour de trois domaines :

  • L'intégration de données, Data Integration
  • La qualité de données, Data Quality
  • La gestion de données référentielles, Master Data Management

Notons que Talend propose une suite « Talend Integration Suite (TIS) », soumise à souscription annuelle, qui comprend des fonctionnalités très avancées comme la gestion des déploiements complexes, la supervision des exécutions et la gestion de référentiels partagés.

Comme PDI, Talend sera avantageusement utilisé dans des projets décisionnels mais trouvera encore plus sa place dans des projets d’urbanisation de systèmes d’information permettant d’uniformiser les modes d’échanges entre les différentes applications de l’entreprise.