Qu’est-ce qu’une métadonnée ?
Les données sont aujourd’hui une priorité pour les entreprises, qui s’efforcent de mettre en place des stratégies data driven dans tous les domaines. Néanmoins, la gestion des métadonnées est parfois négligée, quand elle n’est pas tout simplement oubliée… Qu’est-ce qu’une métadonnée ? Quels sont ses fonctions et ses avantages ? Voici le tour de la question.
Métadonnée : définition
Une métadonnée (aussi appelée metadata) est une donnée permettant de définir ou de décrire une autre donnée. Construit avec le préfixe grec « meta », ce terme pourrait se traduire littéralement par « à propos des données ».
Ainsi, les métadonnées fournissent des éléments sur le contexte, la création, la modification, le traitement ou l’utilisation des données. Elles peuvent être utilisées dans de nombreux cas de figure : bases de données relationnelles, pages web, fichiers bureautiques, images, vidéos…
Quelques exemples de métadonnées d’un documentTitreAuteurDate de créationDate de modificationMots-clésDescriptionFormatTailleLangue |
Quel est le rôle des métadonnées ?
Les métadonnées remplissent trois rôles principaux.
Un rôle descriptif
Une métadonnée descriptive a vocation à apporter des détails supplémentaires sur une donnée afin de la rendre unique. Elle permet de comprendre le contenu d’un document et de connaître son titre, son auteur ou encore sa date de création.
Un rôle structural
Une métadonnée structurale fournit des indications sur la façon dont la data doit être classée, afin de l’intégrer dans un système plus large. Elle peut définir le format, le support ou encore la technique de production d’une donnée. Elle permet d’améliorer l’organisation de la data afin de l’exploiter au mieux.
Un rôle administratif
Une métadonnée administrative donne des informations sur l’historique d’une donnée, son propriétaire et les utilisations qui peuvent en être faites. En entreprise, ce type de metadata est très utile pour les personnes en charge de la data et de la conservation des ressources numériques.
Gestion des métadonnées : quels avantages pour l’entreprise ?
Les métadonnées ont de nombreuses opportunités à offrir aux entreprises qui en font bon usage. En effet, elles fournissent de précieuses informations qui peuvent aider les organisations dans leurs démarches de gestion électronique des documents et de Business Intelligence.
Utilisées dans un moteur de recherche interne, les métadonnées permettent de simplifier l’accès à la data, d’effectuer des recoupements et des analyses et d’identifier plus facilement les différentes sources d’informations.
La gestion des métadonnées (ou « metadata management« ) est également très utile pour améliorer la qualité des informations. Ces dernières sont automatiquement nettoyées, classées et triées dès leur ingestion dans le système d’information, grâce à un processus de collecte des données optimisé. De quoi simplifier considérablement la data preparation.
Par conséquent, l’entreprise peut valoriser sa data pour la prise de décisions stratégiques, avec l’appui de la data visualisation. Un avantage non négligeable, car des données médiocres affectent le quotidien de nombreuses organisations, les empêchant d’exploiter tout le potentiel du Big Data.
Enfin, les metadatas sont indispensables pour trier et identifier les données sensibles, afin de se mettre en conformité avec les réglementations en vigueur (comme le RGPD).
Quelles sont les limites des métadonnées ?
Pour être réellement pertinentes, les métadonnées doivent être coordonnées, conservées et mises à jour régulièrement. Cela implique la mise en place d’une véritable politique de gouvernance des données (ou « data governance« ), encadrant la gestion des données de l’entreprise. Faute de quoi, l’organisation s’expose à d’importantes pertes de temps, mais aussi à des problèmes de non-conformité.
En effet, les documents détenus par une entreprise contiennent souvent des données à caractère personnel, dont l’utilisation est strictement encadrée par le règlement général sur la protection des données (RGPD) dans l’Union européenne. Or, la metadata n’échappe pas à ces contraintes réglementaires.
- La conservation sans limite de durée d’un document et de ses métadonnées est possible, à condition que la communication de ces données personnelles ne puisse porter préjudice à quiconque. Ce cas de figure concerne notamment les documents conservés à des fins archivistiques, historiques ou statistiques.
- Pour un document à durée de vie limitée, la conservation dans le data warehouse doit se restreindre à la durée de traitement requise pour l’activité exercée par les personnes qui en font usage. Passé ce délai, il est nécessaire de détruire le document et toutes les métadonnées recensant des informations à caractère personnel.
Les normes et standards de métadonnées
Une norme (ou standard) de métadonnées est une exigence visant à établir une compréhension commune de la signification ou de la sémantique de la data. Elle garantit un usage correct et approprié des données, ainsi qu’une interprétation cohérente de ces dernières, par leurs utilisateurs et leurs propriétaires.
Le standard de métadonnées Dublin Core est sans doute le plus connu d’entre eux. Développé par la Dublin Core Metadata Initiative (DCMI) en 1995, à l’occasion d’un atelier à Dublin dans l’Ohio, ce référentiel issu d’un consensus international et multidisciplinaire a pour objectif de décrire des documents de manière simplifiée et standardisée. Il fait l’objet de la norme ISO 15836 depuis 2003.
En dehors du Dublin Core, il n’existe qu’une poignée de standards disponibles en langue française :
- La norme ISO 21127 sur le patrimoine culturel immatériel, utilisée pour modéliser l’information numérique relative au patrimoine culturel.
- La norme ISO 15489 sur la gestion des documents d’archives.
- Le Learning Object Metadata (LOM), qui correspond à la norme AFNOR NF Z76-041-1.
Le déploiement d’une solution de gestion des métadonnées est incontournable pour les entreprises désireuses d’accéder facilement à leur data et d’améliorer la qualité de cette dernière, tout en garantissant leur conformité réglementaire. Néanmoins, la metadata présente des limites et son usage doit être encadré par une politique de gouvernance des données ou par une norme stricte.