Aperçu
Les 5 questions que vous devriez vous poser sur la gouvernance de vos données
Le traitement des données a tendance à se déplacer en périphérie des systèmes. Vous trouverez ici toutes les informations dont vous avez besoin pour encourager l'innovation agile.
À mesure que le monde devient de plus en plus connecté, le traitement des données a tendance à se déplacer en périphérie des systèmes. Selon Gartner, plus de la moitié des données générées par les entreprises seront créées et traitées en-dehors des datacenters et du cloud d'ici 2022. Il est utile de noter que cette prédiction date d’avant la pandémie de COVID-19, laquelle a nettement contribué à accélérer la transition vers le travail à distance et un monitoring hors des limites du bureau.
Aujourd’hui, les emplacements sur lesquels les données sont générées sont de plus en plus nombreux et les réglementations en matière de confidentialité se veulent toujours plus strictes. Par conséquent, il devient de plus en plus compliqué de maintenir un équilibre entre la protection des données et le fait de permettre au plus grand nombre d’y accéder. Toutefois, l’innovation ne peut pas se poursuivre si l’intégrité et la sécurité des données sur lesquelles reposent les technologies variées et distibuées que nous utilisons ne sont pas assurées. À titre d’exemple, certains ont attribué la baisse récente des investissements en matière d’intelligence artificielle (IA) à un manque de confiance dans les données qui alimentent les algorithmes. Or une gouvernance adaptée permet de garantir la qualité et la visibilité des données, ce qui renforce la confiance accordée aux technologies d’IA, ainsi qu’à d’autres innovations de pointe.
Si vous êtes occupés à définir un cadre de gouvernance des données capable de supporter une infrastructure agile, il est important que vous vous posiez les bonnes questions afin de vous assurer que vous ne vous contentez pas seulement de protéger ces données, mais que vous vous préparez à mettre en place une culture de l’innovation et de la collaboration agile. Vous trouverez ici une liste des quelques questions essentielles que vous devriez vous poser, établie avec l’aide de Mike Dampier, Senior Account Executive chez Teradata :
1. Qui se charge du déploiement des données ?
Historiquement, la protection et la gouvernance des données ont toujours fait l’objet de débats houleux parmi les décideurs. En effet, les partisans de la technologie ont tendance à exhorter les entreprises à prendre possession de « leurs » données. Dans le contexte actuel, ces questions donnent lieu à des discussions de plus en plus complexes. Alors que les utilisateurs métier sont appelés à innover à partir des données sur de multiples plateformes, la responsabilité du déploiement et de la gestion des données est désormais partagée entre le service informatique et les utilisateurs métiers.
Toutefois, les données déployées par les équipes informatiques et les utilisateurs métiers ont une histoire, une provenance et des cycles de vie très différents. C’est pourquoi Teradata recommande que les équipes informatiques demeurent responsables de la propriété et du déploiement des données d’entreprise, qui comprennent les données d’applications, les données de confiance, les données transactionnelles, ainsi que les master data. Les utilisateurs métiers, quant à eux, ont pour tâche d’intégrer ces données avec d’autres issues de sources différentes, comme les données externes qui relèvent du domaine public (données météorologiques) ou encore les données achetées par les entreprises (données démographiques et psychographiques), qui sont contenues dans leurs sandboxes, leurs data lakes et d'autres environnements.
Il est essentiel de déterminer qui utilise quels types de données et à quelle fréquence celles-ci sont consultées. Nous avions ce besoin à l’esprit lorsque nous avons conçu Teradata Vantage, ce qui a permis de simplifier le monitoring des sessions de connexion et des requêtes utilisateurs. Afin de bénéficier de ce degré de visibilité, certaines plateformes nécessitent le développement et le déploiement d’une multitude de méthodes de monitoring, dont certaines sont entièrement automatisées, mais d’autres représentent encore un processus essentiellement manuel.
2. Qui gouverne quoi?
Il s'agit d'une question délicate. Supposer que le groupe qui s’est chargé de l’ingestion des données devrait s’occuper de leur gouvernance n’est pas complètement injustifié. Du point de vue de la qualité, l’entreprise reste entièrement propriétaire de la gouvernance des données, ainsi que des métadonnées métier associées aux données d’entreprise. Néanmoins, elle est désormais également responsable de la gouvernance du contexte des données métier qu’elle ingère (à savoir les métadonnées relatives au métier ou à la technique) afin de garantir leur intégration avec les données d’entreprise (lorsque cela se révèle nécessaire).
3. Où les données sont-elles déployées ?
Cette question peut donner lieu à des débats animés. Si vous vous êtes déjà mis à la recherche d’un fournisseur de services cloud, vous vous êtes probablement entendu dire à maintes reprises : « Vous devriez stocker toutes vos données chez nous. » Chez Teradata, nous vous conseillons de déployer certaines de vos données dans votre data lake, sur site ou dans le cloud. En parallèle, d’autres devraient résider dans des sandboxes, des data labs ou des data marts. Enfin, vos données de confiance nettoyées et organisées devraient être conservées au sein de votre entrepôt de données.
Il est primordial que les plateformes soient interconnectées au sein d’une structure à haut débit qui permet des projections physiques et virtuelles. Le service informatique a pour responsabilité d’établir un cadre de gouvernance des données approprié pour prendre en charge cette infrastructure. Le déploiement de technologies de virtualisation des données, gérées de manière centralisée et évolutive, facilite le partage de données pendant au moment de l'exécution sans nécessiter la mise en place des processus de synchronisation des données trop complexes. Ces solutions permettent de générer une véritable valeur métier dans certains cas d’usage liés à l’analyse de données et devraient être déployées au sein votre écosystème d’analyse en tant que capacités standard.
4. Tout le monde s’accorde-t-il sur les manières de définir les données?
Les utilisateurs métier ont besoin de savoir où se trouvent les données dont ils ont besoin, mais aussi de comprendre ce qu’elles représentent. Comme l’écrit Jeff Burk dans Datanami : « Le volume, la diversité et le périmètre des données d’entreprise accessibles augmente de manière exponentielle. Il devient donc de plus en plus difficile de les trouver, de les comprendre et de leur faire confiance. » Jeff Burk conseille de mettre au point des systèmes qui permettent aux équipes informatiques et aux utilisateurs métier de se comprendre. Un catalogue gouverné de données pourrait par exemple permettre de traduire les données en langage métier, puis de connecter et de lier les différents ensembles de données entre eux.
5. Vos collaborateurs ont-ils un rôle à jouer dans la gouvernance des données ?
Comme pour toute forme de gouvernement, la mise en place de technologies et de processus appropriés ne garantit pas un leadership adapté. Ce sont bel et bien les collaborateurs qui déterminent si la gouvernance est véritablement efficace. Les outils et les processus mis en place dans le cadre de la gouvernance des données ne peuvent fonctionner que si les personnes qui les utilisent dans leurs tâches quotidiennes les maintiennent à jour.
Une bonne communication entre le service informatique et les utilisateurs métier est essentielle à chaque étape du processus. Etant donné que l’équipe informatique est chargée de mettre en place un accès sécurisé aux données d’entreprise et de créer des outils d’analyse en libre-service, il est important que les utilisateurs métier fassent preuve de transparence et de candeur concernant ce qui fonctionne ou non. Ils peuvent s’appuyer sur la ressource que représente l’équipe informatique pour prendre en charge la gestion des processus une fois ceux-ci créés. De son côté, l’équipe informatique doit se préparer à endosser de nouvelles responsabilité en matière de gouvernance afin de mettre en place un écosystème d’analyse de données prospère, autosuffisant et rentable.
Si vous avez pour objectif de mettre au point la meilleure gouvernance des données possible, prenez un moment pour vous poser ces questions. Les bénéfices d’une bonne gouvernance dépassent la protection et l’intégrité des données et permettent de créer de la valeur métier, de favoriser la prise de décisions stratégiques mieux informées et de donner naissance à une culture plus agile et collaborative.