Pour savoir où on va, il faut savoir d'où l'on vient

Vous avez
une question ?
Un projet ?

Contactez nous !
 

Contactez-nous

Vous avez une question ? un projet ? 
Vous souhaitez plus d'informations sur un produit ? sur notre offre ? 
Contactez-nous, on vous répond sous 4H.

retour

Les principes de l’ETL

Les principes de l’ETL

Pour alimenter le datawarehouse des différentes applications de l’entreprise, on utilise une gamme d’outils appelés ETL, pour « Extract, Transform, Load ». Comme le nom l’indique, ces outils permettent d’extraire des données à partir de différentes sources, de les transformer (format, dénomination), et de les charger dans la base de données cible, ici le datawarehouse.

Les transformations confiées à un ETL sont souvent simples, mais elles peuvent dans certains cas inclure des traitements procéduraux, de véritables programmes spécifiques.

Un ETL permet d’éviter la réalisation de programmes batch répétitifs, souvent semblables, dont il faudra également assurer la maintenance. Le principe est que l’intégration d’un nouveau flux de données ne requiert aucun développement, et s’opère par une simple configuration interactive : on choisit les éléments de données dans le référentiel source, on indique les transformations simples qu’ils doivent subir, et on précise la destination de la donnée dans le datawarehouse.

L’ETL peut prendre en charge différentes natures de sources de données, tant en entrée qu’en sortie, les principales étant bien sûr les SGBD relationnels, et les flux XML, mais il peut s’agir aussi de fichiers à formats fixes ou avec séparateurs (CSV).

Une fois qu’un flux d’extraction-transformation-chargement a été défini, il est généralement déclenché de manière régulière, ceci sous le contrôle d’un outil de planification de tâches, ou bien d’ordonnancement. (…)

Un ETL traite généralement des flux de point à point, c’est à dire entre une source unique et une destination unique.

L’ETL a vocation à travailler en différé, le plus souvent la nuit. Un datawarehouse enregistrant par nature une succession de « photos » de l’activité de l’entreprise, l’ETL va permettre d’alimenter le datawarehouse d’une « photo » supplémentaire. Une fois l’alimentation faite, les données ainsi chargées deviennent statiques et sont alors mises à la disposition des utilisateurs.

Les principes de l’ETL