Formation ontologies et éditeur Protégé-OWL par la pratique, Niveau 2 (201)
OBJECTIF ET RESUME
Cette formation «pratique» de trois jours vise à fournir aux participants des notions avancées sur l’éditeur d’ontologies Protégé-OWL, en particulier sur les rôles complexes et la classification automatique, la réutilisation d’ontologies et l’interrogation d’ontologies avec les règles logiques et SPARQL. Dans cette formation, il s’agit non seulement d’explorer les possibilités d’expressivité d’OWL avec Protégé, mais également de comprendre, au-delà de comment construire une ontologie, comment en réutiliser, en particulier pour les bonnes pratiques de modélisation, et comment les exploiter dans des applications web sémantique, avec, entre autres, les requêtes SPARQL.
PRE-REQUIS
Avoir suivi la formation « ontologies et éditeur Protégé-OWL par la pratique, Niveau 1 » (voir le programme) ou a minima avoir une première expérience de Protégé et/ou de la construction d’ontologies en OWL.
L’installation de Protégé 5.0 ainsi que de Graphviz est à prévoir en amont de la formation sur les postes des participants. Des consignes d’installation seront fournies à cette fin.
PROGRAMME DU COURS
Fonctions avancées de Protégé desktop en pratique
- Introduction des rôles complexes sur l’ontologie « généalogie famille » grâce à une première série d’exercices qui aborderont la création et la manipulation d’individus et de chaîne de propriétés.
- La classification automatique avec le raisonneur sera utilisée à travers une série d’exercices pour illustrer les conséquences des chaînes de propriétés ainsi que l’hypothèse du monde ouvert (OWA : Open World Assumption).
- Utilisation de plugins afin d’aborder une série d’exercices d’import, d’apprentissage de classes à partir d’individus, d’alignement, de merge et de comparaison d’ontologies avec l’ontologie « généalogie famille ». On utilisera les plugins suivants : Cellfie, owl-diff, DL-learner.
Cycle de vie d’une ontologie
- Point théorique sur les activités autour des ontologies. On abordera en particulier les aspects de construction sur questions de compétences ainsi que les aspects d’évaluation et validation. Les aspects concernant le cycle de vie des ontologies seront également abordés. On adressera la réutilisation (import, export, alignement, fusion, intégration, annotation) ainsi que l’évolution et la maintenance.
- Dans le cadre du questionnement sur la provenance et la fiabilité d’informations à réutiliser, le modèle PROV-O sera présenté.
- Les meilleures pratiques seront introduites par l’approche Ontology Design Pattern (ODP), illustrée elle-même par le cas d’usage Scholarlydata. Une série d’exercices de recherche d’ODP pour l’ontologie « généalogie famille » s’ensuivra pour les pratiquer.
Interroger les ontologies avec SPARQL
- Exercices de requêtes DL avec le « DL query tab » de Protégé
- Introduction à SPARQL, type de requêtes et anatomie d’une requête
- Requêtes SPARQL « simples » sur l’ontologie « généalogie famille », à partir de Protégé (Série 6)
- Usage d’aggrégation et filtres (avec également regex) dans les requêtes SPARQL sur l’ontologie « généalogie famille », à partir de Protégé
- Interrogation d’endpoints SPARQL (dbpedia, yago, scholarlydata, FactForge)
- Réalisation de construct à partir de dbpedia, puis import dans Protégé
Vue d’ensemble de l’architecture des applications web sémantique à base d’ontologies
- Architecture d’intégration de sources de données différentes grâce à SPARQL
- Stockage de graphe grâce aux Triple Stores
- Les outils et framework existants pour créer des applications web sémantique.
- Pour conclure, quelques exemples d’applications et leur architecture.