Prochaine session état de l’art Machine Learning and Cybersecurity: why and how with scikit-learn les 23 et 24 septembre

Prochaine session executive education Apprentissage automatique, les briques technologiques pour les PME le 25 septembre

Prochaine édition SPOC Impact du numérique sur l’environnement à partir du 29 septembre

Prochaine session deeptech Scikit-learn, la boîte à outils de l’apprentissage automatique avancé les 6 et 7 octobre

Prochaine session deeptech Analyse des données de santé sensibles par l’apprentissage fédéré le 8 octobre

Toutes nos formations
graphes de connaissance Intelligence artificielle

Mapping de données existantes vers des graphes de connaissances RDF

 Module deeptech 
Plusieurs langages permettent aujourd’hui de décrire la transformation de données structurées (RDB, JSON, CSV) en graphes RDF. Ils automatisent cette conversion, facilitant l’interopérabilité avec le Web sémantique et l’intégration des données dans des graphes riches et interconnectés. © Inria / Photo S. Erôme - Signatures

Session:

Aucune session disponible actuellement.

Contactez-nous !

Objectifs

Ce cours s’adresse à des ingénieurs en informatique impliqués dans l’intégration de données hétérogènes au cœur des systèmes d’information. Son premier objectif est de vous fournir un panorama des langages existants pour décrire la transformation – le « mapping » – de données structurées (RDB, JSON, CSV…) vers des graphes de connaissances au format RDF. Ce que l’on appelle également le « lifting » de données. L’idée est de générer des graphes reposant sur des vocabulaires et ontologies de votre choix, soit génériques comme Schema.org, soit spécifiques à votre domaine ou votre entreprise. Nous insisterons plus particulièrement sur les langages de mapping R2RML, RML, xR2RML et CSVW.

Dans un deuxième temps, une session pratique vous permettra d’expérimenter plusieurs outils implémentant ces langages, pour mapper vos données JSON et CSV vers RDF.

Dans une dernière partie, nous aborderons la production des métadonnées permettant de documenter et indexer les graphes de connaissances produits, puis nous évoquerons les évolutions en cours dans le domaine des langages de mapping avec le travail du groupe communautaire du W3C « Knowledge Graph Construction » et les extensions de RML.

Public cible : ingénieurs développeurs informatique et ingénieurs R&D.

Pré-requis

  • Maitrise des formats de données courants : CSV, JSON ;
  • Connaissances des standards du Web de données : modèle RDF et ses syntaxes Turtle et JSON-LD, SPARQL ;
  • Habitude des environnements en ligne de commande (bash, command Windows).

Programme

Demie-journée 1 :

  • Panorama des langages et méthodes permettant de décrire la transformation de données hétérogènes en graphes RDF
  • Rappels sur les syntaxes RDF utiles pour ce cours : Turtle, JSON-LD
  • Le standard du W3C R2RML et ses dérivés : principes, syntaxes
    • R2RML, R2RML-F, FunUL, FnO, xR2RML, RML
  • RML en détails : exemples, mise en oeuvre, bonnes pratiques
  • Le cas des données CSV : le standard du W3C CSVW
  • Session pratique (1/2) : mapper des fichiers JSON/CSV avec le langage RML et l’outil RMLMapper

Pendant la session pratique, chaque apprenant peut travailler sur des cas d’usage concrets en s’appuyant sur « ses » données.

Demie-journée 2 :

  • Session pratique (2/2) : suite de la session de pratique de la première demie-journée
  • Ecrire un mapping RML plus facilement : YAML ou interface graphique ?
  • Documenter un graphe :
    • Vocabulaires standards de métadonnées : DCAT, VoID, SPARQL-SD
    • Exemple de l’outil Metadatamatic
    • Vers un RML 2.0 : perspectives et évolutions

Intervenant(s)

  • Franck Michel

    Ingénieur de recherche Inria

    Franck Michel est ingénieur de recherche CNRS au laboratoire I3S, et membre de l’équipe-projet Wimmics du centre Inria d’Université Côte d’Azur. Après avoir travaillé pendant 14 ans dans le secteur privé, il a soutenu sa thèse de doctorat en 2017 sur la fédération de données hétérogènes et leur publication sur le web de données.

    Ses travaux de recherche ont trait à l’ingénierie des connaissances et leur représentation sous forme de graphes, le web sémantique et le web de donnée liées (Linked Data). Il est ou a été impliqué dans plusieurs projts visant l’exploitation de ces technologies dans différents domaines comme la littérature scientifiqe (ISSA), la biodiversité (collaboration avec le Muséum National d’Histoire Naturelle de Paris, Bioschemas.org, GDR SemanDiv), l’agronomie et l’agriculture (ANR D2KAB). Il est membre du Knowledge Graph Construction Community Group du W3C qui vise à proposer un standard pour le langage d mapping RML. L’objectif commun à toutes ces initiatives est de permettre la réutilisation et la valorisation des données en les publiant sur le web dans le respect des principes FAIR.

    @coll.privée

1
/ pers.

Aucune session disponible actuellement.

Contactez-nous