(source: Iryna Solodovnik in Bibliotime, XIV, 2, juillet 2011 – Communication et recherche sémantique de contenus informationnels entre métadonnées, linked open data et ontologies)
Les métadonnées dans le monde de l’information
Les métadonnées constituent actuellement les bases fondamentales du “nouveau” web en matière d’indexation, d’identification, de classification, d’authentification, de conservation, d’intégrité et de gestion des droits, de distribution, de recherche et de récupération des ressources numériques. Qu’elles soient descriptives, administratives, structurelles, elles contribuent à une gestion plus claire et modulaire des objets/collections numériques.
Le mapping des différents types de métadonnées, mené en parallèle, permet de plus en plus d’affronter la délicate question des équivalences sémantiques. L’analyse des applications qui se mettent en place permet d’identifier la granularité avec laquelle peuvent être traitées les ressources informationnelles.
Ces dernières années, des standards de métadonnées permettent de gérer la certification des contenus, leur représentation pour la recherche, la conservation à court, moyen et long terme de ces contenus: LOM (Learning Object Metadata), TEI (Text Encoding Initiative), PREMIS, etc.
L’utilisation de ces standards, de ces normes permet de créer à partir des métadonnées des conditions d’accès et de diffusion des informations de qualité et de plus en plus précises. La qualité des métadonnées peut être améliorée à travers un processus de normalisation qui prévoit l’utilisation de terminologies, de vocabulaires contrôlés, etc.
Le choix des schémas de métadonnées est primordial dans l’implémentation et le support des archives ouvertes/dépôts institutionnels-disciplinaires (cf. bien sûr OAI – Open Archives Initiative et OAI-PMH – Open Archives Initiative Protocol for Metadata Harvesting qui permet de récolter des données d’origines variées et de les chercher de manière intégrée).
Méta(données), linked (open) data et ontologies
Lors de la conférence WWW2011, le workshop consacré aux Linked Data on the Web a mis l’accent sur le web en tant qu’espace d’information global, constitué non seulement de documents liés, mais aussi de (méta)données liées. L’objectif est de créer des ensembles de données et de les relier directement à des ensembles existants, ce qui permet d’éviter des duplications de données inutiles et de maintenir une mise à jour de ces données efficace. Les linked data se basent sur des standards du web tels que le protocole HTTP, bien sûr, les URIs (Uniform Resource Identifier), RDF (Resource Description Framework). Cf. les projets Open Definition et Open Data Commons. Ces ensembles de données reliées sont graphiquement représentés dans un LOD cloud diagram. Il s’agit d’une représentation possible, il en existe bien entendu d’autres.
-Réseau d’ontologies
Cette représentation repose sur le concept de “réseaux d’ontologies“, qui permettent de se mouvoir d’un ensemble de données conceptuel à un autre et de découvrir de nouveaux univers de contenus reliés à l’ensemble de départ. Exemple: imaginons a) un dépôt institutionnel, b) une plateforme de CVs, c) une base de données d’évaluation de la recherche scientifique: relier ces ensembles pourraient apporter une plus-value à l’ensemble des acteurs en présence.
LOD (Linking Open Data)
On l’a vu, afin de décrire le modèle sémantique d’un certain domaine, il faut: 1) s’accorder sur le choix d’un vocabulaire pour représenter explicitement les aspects conceptuels; 2) définir le profil des métadonnées et de leurs propriétés; 3) rendre explicite, à travers la syntaxe et le vocabulaire du ou des modèles de métadonnées, les classes et les propriétés de ces modèles; 4) normaliser et relier le domaine “naissant” à des domaines existants; 5) définir et décrire les cardinalités entre les classes de métadonnées avec RDF (et ses ontologies).
-LOD: applications pratiques
Belgique: projet Archipel (UGhent)
Finlande: projet FinnONTO (cf. DataFinland)
-LOD et données bibliographiques
Des données bibliographiques ouvertes, reliées et réutilisables? On y travaille:
- Working Group on Open Bibliographic Data (Open Knowledge Foundation)
- Open Bibliographic Data (JISC, UK)
- Open Definition : Open Bibliographic Data
Des travaux sont également en cours pour rendre explicites en RDF des standards comme MODS (Metadata Object Description Schema) ou le MARC:
- cf. le projet du MIT qui vise à convertir du MODS ou du MARC en RDF
- cf. également Bibliographic Ontology Specification
- cf. aussi MODS Ontology
Enfin, citons l’initiative de l’Open Knowledge Foundation, Open Bibliography Principles, la “déclaration de Berlin” en quelque sorte des données bibliographiques ouvertes.
Conclusion: libérer les connaissances
L’objectif pour les institutions productrices de connaissances est bien celui-là: diffuser librement et largement leurs savoirs. Le défi: comment les publier et les contextualiser sur le web, les relier à d’autres ensembles, les rendre facilement accessibles et, à long terme, augmenter de manière significative leur consultation/(ré)utlisation.
Voir la bibliographie ici