Des cartes fiables

Les knowledge graph ne sont pas une technologie nouvelle, mais les enjeux actuels en font repenser les usages pour l'aide à la décision. Les knowledge graph pourraient bien être nos cartes de navigation dans un monde submergé par les données. Car si la carte n’est pas le territoire, elle permet de s’y repérer.

Que sont les knowledge graph?

« Les graphes de connaissances sont l’aboutissement de plus de deux décennies de travail, avec le potentiel de fournir des expériences utilisateur plus intelligentes et plus riches. Forbes,You need to be thinking in knowledge graph

Bryon Jacob

Les knowledge graph sont en sorte des outils pour créer des cartes de navigation dans les données et y naviguer ensuite. Un outil seul n’est rien, toutefois, il peut servir à des intentions décisives. Entre autres ici, celle de de faciliter les échanges d’information, qu’il s’agisse de lier des informations dispersées au sein de l’entreprise ou d’interagir dans des écosystèmes d’affaires.

Concrètement, ils définissent un vocabulaire contrôlé de concepts, de propriétés, de classes définies par certaines de ces propriétés et sur la base de ces déclarations explicites et formelles, on peut décrire des entités, ce qu’elles sont et leurs relations. Ensuite, on peut annoter tout élément de contenu, tout document, toute donnée numérique, par une référence à une entité définie et naviguer au-delà du seul document pour trouver d’autres informations, chez d’autres sources, grâce à des vocabulaires partagés.

Le schéma ci-dessous illustre ce principe.

Principes des graphes de connaissances en trois couches

Pourquoi des infrastructures de données?

Construire des infrastructures de données fiables est un préalable pour alimenter un système de décision collectif.

Néanmoins, nous devons séparer la problématique de l’intégration des solutions de systèmes d’informations de celles des échanges d’informations. Ce ne doivent pas être des contraintes technologiques qui guident les informations partageables ou non. S’il est important pour la décision de disposer de données fiables, ce n’est pas suffisant. Encore faut-il qu’elles soient pertinentes et complètes! Si elles n’éclairent en rien les situations qui posent question, pourquoi les collecter? Il faut revenir à la question de l’information nécessaire et indispensable à partager. Pour en finir avec la tour de babel numérique, sujet de cet article, on peut construire des ponts sémantiques. C’est à dire des graphes de connaissances par domaines, reliés par des concepts communs.

Afin de pouvoir communiquer aisément au sein de l’organisation et partager les connaissances sur ses finalités, sur son écosystème, sur ce qu’elle veut faire, sait faire, peut faire, pourquoi, pour qui. Ce qui permet de structurer et aligner les décisions organisationnelles autour de ces piliers. Nous avons aussi besoin, une fois ces infrastructures en place, de collecter les données et de les restituer en fournissant un moyen de trouver des informations pertinentes et naviguer de l’une à l’autre suivant des liens de sens qui nous permettent d’en comprendre la portée et le contexte.

La notion d’infrastructure de données ne doit absolument pas être subsumée à la technologie. Il s’agit d’abord de disposer des représentations formelles des connaissances qui permettront de lier les données par des vocabulaires partagées, indépendamment de tout algorithme ou solution d’implémentation. Le formalisme ainsi que l’expressivité et la flexibilité des descriptions pour ces représentations sont nécessaires, afin de s’adapter à un environnement incertain. La problématique du Knowledge graph n’est jamais en premier celle du stockage.

L’approche Semsimo

Image extraite de la présentation de Rick Evans à SMWCon 2021_ Why NASA uses Semantic Mediawiki (and why you should too)

Un knowlegde graph, c’est l’instanciation d’une combinaison d’ontologies avec des données liées. Semsimo construit des knowledge graphs avec une approche qui couple les standards du web sémantique pour construire la définition des entités du graphe de connaissance (RDF, OWL), avec celle d’un wiki sémantique (semantic mediawiki) pour collecter les instances du graphe et naviguer entre elles ou les interroger. Cette approche utilise des standards et des briques open source. Ce qui rend également le système ouvert à des correspondances avec d’autres systèmes ou bases de données.

Semantic MediaWiki offre la capacité de transformer un wiki classique en un véritable graphe de connaissances.Grâce aux mécanismes de catégorie et de propriétés, de modèles et de formulaires, il peut qualifier des données avec les vocabulaires définis dans des ontologies.

En enrichissant un wiki ainsi, il fait office d’une plateforme de collecte d’informations et de navigation dans des liens sémantiques. Néanmoins, on en préserve la simplicité d’utilisation et de partage.

Une telle plateforme agit comme système de graphe de connaissances. Lequel peut être utilisé dans tous les domaines de gestion es connaissances nécessitant d’interroger des liens complexes entre de multiples objets d’information. Le Glen Research Center de la Nasa l’utilise ainsi depuis 2009, comme en a témoigné Rich Evans à la conférence SMWCon2021.

Les décisions sur les projets de transformation numérique nécessitent de mettre en pratique ce vieux mantra: fournir la bonne information (utile) à la bonne personne au bon moment. Or les informations utiles naissent de la capacité à lier et contextualiser des données dispersées. Et cela, nous pouvons le faire avec une combinaison d’ontologies et un wiki sémantique.

D’autre part, en utilisant Semantic Mediawiki, nous disposons d’une interface personnalisable de base de connaissances interrogeable par des requêtes sémantiques riches. Le knowledge graph en est le moteur. Les utilisateurs n’ont pas besoin d’en connaître le détail pour conduire leurs recherches.

Slides en vidéo d’une conférence sur les Knowledge Graphs réalisée pour masters spécialisés Centrale-Supélec

top