Prochaine session deeptech Scikit-learn, la boîte à outils de l’apprentissage automatique débutant le 12 décembre

Prochaine session deeptech Méthodes formelles pour les protocoles de cybersécurité les 16 et 17 décembre

Prochaine session deeptech Analyse des données de santé sensibles par l’apprentissage fédéré le 18 décembre

Prochaine session executive education Apprentissage automatique, les briques technologiques pour les PME le 7 janvier – GRATUIT

Prochaine session état de l’art La sécurité informatique face aux menaces quantiques le 8 janvier

Toutes nos formations
graphes de connaissance Intelligence artificielle

Mapping de données existantes vers des graphes de connaissances RDF

 Module deeptech 
Plusieurs langages permettent aujourd’hui de décrire la transformation de données structurées (RDB, JSON, CSV) en graphes RDF. Ils automatisent cette conversion, facilitant l’interopérabilité avec le Web sémantique et l’intégration des données dans des graphes riches et interconnectés. © Inria / Photo S. Erôme - Signatures

Session:

Aucune session disponible actuellement.

Contactez-nous !

Objectifs

Ce cours s’adresse à des ingénieurs en informatique impliqués dans l’intégration de données hétérogènes au cœur des systèmes d’information. Son premier objectif est de vous fournir un panorama des langages existants pour décrire la transformation – le « mapping » – de données structurées (RDB, JSON, CSV…) vers des graphes de connaissances au format RDF. Ce que l’on appelle également le « lifting » de données. L’idée est de générer des graphes reposant sur des vocabulaires et ontologies de votre choix, soit génériques comme Schema.org, soit spécifiques à votre domaine ou votre entreprise. Nous insisterons plus particulièrement sur les langages de mapping R2RML, RML et xR2RML.

Dans un deuxième temps, une session pratique vous permettra d’expérimenter plusieurs outils implémentant ces langages, pour mapper vos données JSON et CSV vers RDF.

Dans une dernière partie, nous aborderons la production des métadonnées permettant de documenter et indexer les graphes de connaissances produits, puis nous évoquerons les évolutions en cours dans le domaine des langages de mapping avec le travail du groupe communautaire du W3C « Knowledge Graph Construction » et les extensions de RML.

Public cible : ingénieurs développeurs informatique et ingénieurs R&D.

Pré-requis

  • Maitrise des formats de données courants : CSV, JSON ;
  • Connaissances des standards du Web de données : modèle RDF et ses syntaxes Turtle/N-Triples, SPARQL ;
  • Habitude des environnements en ligne de commande (bash, command Windows) ;
  • Savoir utiliser l’environnement Docker.

Programme

Demie-journée 1 :

  • Panorama des langages et méthodes de transformation de données hétérogènes en graphes RDF
  • Rappels sur les syntaxes RDF N-Triples et Turtle
  • R2RML, le standard du W3C : principes, syntaxe
  • RML (1/2): comment RML étend R2RML
  • Session pratique (1/2) : mapper des fichiers JSON/CSV avec le langage RML et l’outil RMLMapper

Pendant cette session, chaque apprenant peut travailler sur des cas d’usage concrets en s’appuyant sur « ses » données.

Demie-journée 2 :

  • RML (2/2) : fonctionnalités avancées, limitations, bonnes pratiques
  • Session pratique (2/2) : suite de la session de pratique de la première demie-journée
  • Écrire un mapping RML plus facilement avec YARRRML
  • Documenter un graphe avec des métadonnées : DCAT, VoID, SPARQL-SD, et l’outil Metadatamatic
  • Vers RML 2.0 : perspectives et évolutions

Intervenant(s)

  • Franck Michel

    Ingénieur de recherche Inria

    Franck Michel est ingénieur de recherche CNRS au laboratoire I3S, et membre de l’équipe-projet Wimmics du centre Inria d’Université Côte d’Azur. Après avoir travaillé pendant 14 ans dans le secteur privé, il a soutenu sa thèse de doctorat en 2017 sur la fédération de données hétérogènes et leur publication sur le web de données.

    Ses travaux de recherche ont trait à l’ingénierie des connaissances et leur représentation sous forme de graphes, le web sémantique et le web de donnée liées (Linked Data). Il est ou a été impliqué dans plusieurs projts visant l’exploitation de ces technologies dans différents domaines comme la littérature scientifiqe (ISSA), la biodiversité (collaboration avec le Muséum National d’Histoire Naturelle de Paris, Bioschemas.org, GDR SemanDiv), l’agronomie et l’agriculture (ANR D2KAB). Il est membre du Knowledge Graph Construction Community Group du W3C qui vise à proposer un standard pour le langage d mapping RML. L’objectif commun à toutes ces initiatives est de permettre la réutilisation et la valorisation des données en les publiant sur le web dans le respect des principes FAIR.

    @coll.privée

1
650 / pers.

Aucune session disponible actuellement.

Contactez-nous

Session:

Aucune session disponible actuellement.

Contactez-nous !
/ pers.

Aucune session disponible actuellement.

Contactez-nous

Informations pratiques

  • Tarif : 650€ par participant ;
  • Tarifs dégressifs à partir de 5 personnes (-10% de 5 à 9 inscrits, -20% plus de 10 inscrits)
  • Partenariat avec le pôle  Aktantis : les entreprises membres du pôle bénéficient d’un tarif privilégié de 500 €
  • Durée : 1 journée (6 heures de 9h à 12h et de 14h à 17h)
  • Lieu : en distanciel ou présentiel
  • Nombre de participants : jusqu’à 12 personnes
  • Privatisation : La privatisation de cette formation est possible au sein d’une même entreprise à partir de dix participants
  • Méthodes pédagogiques : la formation intègre des éléments théoriques, certains techniques, d’autres plus généralistes à prendre en compte dans la stratégie
    Le matériel et les ressources nécessaires serons fournis afin de favoriser l’apprentissage autonome après le cours
  • Modalités d’évaluation des acquis de la formation : à l’issue de la formation, l’envoi des questionnaires permettent d’évaluer le niveau des compétences acquises
  • Délais d’accès : la programmation est soumise à la disponibilité des scientifiques d’Inria. Une inscription anticipée est recommandée. La confirmation de la session intervient au plus tard 2 semaines à l’avance à condition que le groupe compte 7 inscris.