top of page

L'importance de la qualité des données



Aujourd’hui, les données constituent sans aucun doute l’un des principaux atouts d’une organisation. Utilisé partout, qu’il s’agisse des opérations quotidiennes d’une entreprise ou du renforcement des initiatives de veille stratégique.


Mais en l’absence de techniques et de meilleures pratiques en matière de qualité des données (qui permettent de suivre et de résoudre les problèmes de qualité des données à temps), une entreprise peut perdre beaucoup d’argent et risquer de se retrouver à la traîne.


Nous allons donc vous indiquer quelles sont les différents point pratiques à utiliser pour assurer la qualité de vos données.



L’évaluation de la qualité des données


La première étape consiste à soumettre toutes les données stockées par l’entreprise à un travail d’inspection détaillé afin d’identifier les zones problématiques (erreurs, incohérences, données dupliquées, champs vides) qui nuisent à la poursuite des objectifs business de l’entreprise.


Il est conseillé, pour cette étape, de faire appel à un tiers extérieur à l’entreprise, qui saura poser un diagnostic objectif sur la situation actuelle. Cette première étape est la base à partir de laquelle toute la démarche de management de la Data Quality pourra se déployer.


Elle permet d’identifier les axes d’amélioration et les actions à mener.


Nous conseillons de mixer :

  • Une approche top-down, qui consiste à partir des pain points au niveau de l’activité et de rechercher leurs causes au niveau de la qualité des données.

  • Une approche bottom-up, qui consiste une analyse des données qui permettra d’identifier les anomalies ayant un impact négatif sur la poursuite des objectifs de l’entreprise.

Ce travail se matérialise par la production d’un rapport listant de manière claire et précise tous les enseignements mis au jour. Ce rapport doit, dans la mesure du possible, être partagé à toutes les parties prenantes. C’est le support de base qui permettra de hiérarchiser et d’ordonnancer les chantiers d’actions prioritaires.


Mesurer et maintenir la définition de la qualité des données


Une fois que vous connaissez l’impact des données sur votre entreprise, l’étape suivante consiste à assurer la qualité des données dans tous les ensembles de données de votre organisation.


Mais avant cela, il est important de comprendre la définition de la qualité des données, car elle a une signification différente pour chaque entreprise.


La qualité des données est définie comme le degré auquel les données remplissent l’objectif prévu. Ainsi, pour comprendre la signification de la qualité des données dans votre cas, vous devez savoir quel est l’objectif visé.


Comment ça marche ?


Pour définir la qualité des données pour votre entreprise, vous devez commencer par identifier les :

  • Sources qui génèrent, stockent ou manipulent des données,

  • Attributs stockés par chaque source,

  • Glossaire des métadonnées qui définit chaque attribut,

  • Les critères d’acceptabilité des valeurs de données stockées dans les attributs, et

  • Les métriques de qualité des données qui mesurent la qualité des données stockées.

Un exemple de définition de la qualité des données dans votre entreprise consiste à dessiner des modèles de données qui mettent en évidence les parties nécessaires des données (la quantité et la qualité des données qui sont considérées comme suffisantes).


Considérez l’image suivante pour comprendre à quoi peut ressembler un modèle de données pour une entreprise de vente au détail :


modèle de données
modèle de données

Hormis la conception de modèles de données, vous devez également identifier des mesures de qualité des données qui confirment la présence d’un niveau de qualité acceptable dans vos ensembles de données.


Par exemple, vous pouvez exiger que votre ensemble de données soit plus précis et plus fiable que complet.


À quoi ça sert ?


Une définition normalisée de la qualité des données permet de mettre tout le monde sur la même longueur d’onde, afin qu’ils puissent comprendre ce que signifie la qualité des données, à quoi elle ressemble et comment elle peut être mesurée.


Cela permet à chaque personne de comprendre et de satisfaire les exigences en matière de qualité des données.


Définir les rôles et les responsabilités en matière de données


Il est communément admis que la garantie de la qualité des données au niveau de l’entreprise nécessite l’implication ou l’adhésion de la direction générale.


En réalité, plus que d’impliquer certaines personnes dans des environnements cloisonnés, vous devez engager des personnes dans les processus existants, et rendre les gens responsables de l’obtention et du maintien de la qualité des données – de la direction de haut niveau au personnel opérationnel.


les rôles et les responsabilités en matière de données
les rôles et les responsabilités en matière de données

Le Chief Data Officer

Le Chief Data Officer (CDO) définit les règles de gouvernance, suit la mise en œuvre et coordonne l’ensemble des activités de Data Management.

Le rôle du CDO :

  • Développer et maintenir une stratégie data,

  • Organiser la gouvernance des données,

  • Définir et promouvoir le modèle de données d’entreprise,

  • Sponsoriser les projets et les services de gestion des données,

  • Communiquer et promouvoir les politiques, les standards et les procédures de gestion des données,

  • Superviser et coordonner les activités de gestion des données,

  • Suivre les coûts liés à la gestion des données et proposer des optimisations.


Le Data Management Exécutive


Le Data Management Exécutive (DME) organise les services de gestion des données, en cherchant à développer le partage et la ré-utilisation pour plus d’efficacité et de cohérence.

Ses missions consistent à :

  • Définir et mettre en œuvre des architectures de données répondant aux besoins métiers,

  • Définir et maintenir un cadre de mutualisation des services transverses liés aux données,

  • Coordonner et piloter les projets d’évolution de l’architecture des données,

  • Suivre les coûts liés à la gestion des données et proposer des optimisations,

  • Garantir la mise en œuvre dans le SI des contrôles permettant le respect des exigences de qualité et des contraintes réglementaires.

Le Data Steward

Le Data Steward (par famille de données) décrit les besoins de gestion des données dont il a la charge en fonction des usages. Il suit la mise en œuvre et veille à délivrer des données de juste qualité.

Son rôle consiste à :

  • Comprendre les processus liés à la collecte de la donnée et à sa consommation,

  • Recenser les besoins et les exigences relatifs aux données, les hiérarchiser, et proposer des solutions / services en coordination avec le DME,

  • Mettre en œuvre les bonnes pratiques de gestion des données en coordination avec le CDO,

  • Gérer et résoudre les problèmes liés aux données,

  • Suivre les coûts liés au Data Management sur son périmètre et proposer des optimisations.

Choisir son outil de gestion de la qualité des données


Les règles de mise en qualité sont bien sûr propres à chaque métier mais elles doivent obéir aux grands principes de la stratégie data et aux processus qui pérennisent les travaux de mise en qualité.

D’après l’expérience tirée de nos missions chez nos clients, le développement en interne d’une solution de gestion de la qualité de données n’est pas la voie la plus efficace ni la plus rentable.


En effet, les fonctionnalités à implémenter sont nombreuses et compliquées à maintenir. Il est préférable de se tourner vers les produits proposés par des éditeurs de logiciel spécialistes en la matière.

Selon le rapport d’étude MarketsandMarkets™ autour du marché des outils de qualité des données, le paysage concurrentiel est dominé à 90% par 4 outils : Talend, Informatica, Collibra, Ab Initio.

Le choix d’un outil de gestion de la qualité des données nécessite de cartographier au préalable les usages et fonctionnalités à couvrir par la solution, puis d’évaluer les critères de choix : richesse et pertinence des fonctionnalités, prix, pérennité de la solution, expérience utilisateur, intégration dans le SI, formation, reporting qualité…

Nous souhaitons par conséquent insister sur le fait que les outils ne sont pas une fin en soi. Seuls les référentiels de contrôle et l’évaluation de la qualité le sont.


Dispositif de maintien de la qualité des données

Le maintien de la qualité des données nécessite la mise en œuvre de bons KPIs (indicateurs de performance clés) pour mesurer :

  • des critères intrinsèques aux données elles-mêmes,

  • des critères de services liés à l’utilisation de ces données,

  • des critères de sécurité liés à l’ensemble du dispositif de gestion des données.

Enfin, au-delà des processus et des outils, la sensibilisation et la montée en compétences des équipes impliquées dans le processus de gestion de la qualité des données doivent être intégrées à la stratégie de conduite du changement.

La confiance entre les équipes ainsi que l’implication et la formation de chaque partie prenante sont primordiales.


 

Les meilleurs outils pour votre data management



Sales cloud



marketing cloud



Analytics












0 commentaire
bottom of page