Prochaine session état de l’art Machine Learning and Cybersecurity: why and how with scikit-learn les 23 et 24 septembre

Prochaine session executive education Apprentissage automatique, les briques technologiques pour les PME le 25 septembre

Prochaine édition SPOC Impact du numérique sur l’environnement à partir du 29 septembre

Prochaine session deeptech Scikit-learn, la boîte à outils de l’apprentissage automatique avancé les 6 et 7 octobre

Prochaine session deeptech Analyse des données de santé sensibles par l’apprentissage fédéré le 8 octobre

Toutes nos formations
graphes de connaissance Intelligence artificielle

Mapping de données existantes vers des graphes de connaissances RDF

 Module deeptech 
Plusieurs langages permettent aujourd’hui de décrire la transformation de données structurées (RDB, JSON, CSV) en graphes RDF. Ils automatisent cette conversion, facilitant l’interopérabilité avec le Web sémantique et l’intégration des données dans des graphes riches et interconnectés. © Inria / Photo S. Erôme - Signatures

Session:

Aucune session disponible actuellement.

Contactez-nous !

Objectifs

Ce cours s’adresse à des ingénieurs en informatique impliqués dans l’intégration de données hétérogènes au cœur des systèmes d’information. Son premier objectif est de vous fournir un panorama des langages existants pour décrire la transformation – le « mapping » – de données structurées (RDB, JSON, CSV…) vers des graphes de connaissances au format RDF. Ce que l’on appelle également le « lifting » de données. L’idée est de générer des graphes reposant sur des vocabulaires et ontologies de votre choix, soit génériques comme Schema.org, soit spécifiques à votre domaine ou votre entreprise. Nous insisterons plus particulièrement sur les langages de mapping R2RML, RML et xR2RML.

Dans un deuxième temps, une session pratique vous permettra d’expérimenter plusieurs outils implémentant ces langages, pour mapper vos données JSON et CSV vers RDF.

Dans une dernière partie, nous aborderons la production des métadonnées permettant de documenter et indexer les graphes de connaissances produits, puis nous évoquerons les évolutions en cours dans le domaine des langages de mapping avec le travail du groupe communautaire du W3C « Knowledge Graph Construction » et les extensions de RML.

Public cible : ingénieurs développeurs informatique et ingénieurs R&D.

Pré-requis

  • Maitrise des formats de données courants : CSV, JSON ;
  • Connaissances des standards du Web de données : modèle RDF et ses syntaxes Turtle/N-Triples, SPARQL ;
  • Habitude des environnements en ligne de commande (bash, command Windows) ;
  • Savoir utiliser l’environnement Docker.

Programme

Demie-journée 1 :

  • Panorama des langages et méthodes de transformation de données hétérogènes en graphes RDF
  • Rappels sur les syntaxes RDF N-Triples et Turtle
  • R2RML, le standard du W3C : principes, syntaxe
  • RML (1/2): comment RML étend R2RML
  • Session pratique (1/2) : mapper des fichiers JSON/CSV avec le langage RML et l’outil RMLMapper

Pendant cette session, chaque apprenant peut travailler sur des cas d’usage concrets en s’appuyant sur « ses » données.

Demie-journée 2 :

  • RML (2/2) : fonctionnalités avancées, limitations, bonnes pratiques
  • Session pratique (2/2) : suite de la session de pratique de la première demie-journée
  • Écrire un mapping RML plus facilement avec YARRRML
  • Documenter un graphe avec des métadonnées : DCAT, VoID, SPARQL-SD, et l’outil Metadatamatic
  • Vers RML 2.0 : perspectives et évolutions

Intervenant(s)

  • Franck Michel

    Ingénieur de recherche Inria

    Franck Michel est ingénieur de recherche CNRS au laboratoire I3S, et membre de l’équipe-projet Wimmics du centre Inria d’Université Côte d’Azur. Après avoir travaillé pendant 14 ans dans le secteur privé, il a soutenu sa thèse de doctorat en 2017 sur la fédération de données hétérogènes et leur publication sur le web de données.

    Ses travaux de recherche ont trait à l’ingénierie des connaissances et leur représentation sous forme de graphes, le web sémantique et le web de donnée liées (Linked Data). Il est ou a été impliqué dans plusieurs projts visant l’exploitation de ces technologies dans différents domaines comme la littérature scientifiqe (ISSA), la biodiversité (collaboration avec le Muséum National d’Histoire Naturelle de Paris, Bioschemas.org, GDR SemanDiv), l’agronomie et l’agriculture (ANR D2KAB). Il est membre du Knowledge Graph Construction Community Group du W3C qui vise à proposer un standard pour le langage d mapping RML. L’objectif commun à toutes ces initiatives est de permettre la réutilisation et la valorisation des données en les publiant sur le web dans le respect des principes FAIR.

    @coll.privée

1
/ pers.

Aucune session disponible actuellement.

Contactez-nous