Porteur du projet
ORANGE InnovationPartenaires
EURECOM, IRIT (Institut de Recherche en Informatique de Toulouse)Financeurs
ANR,ECLADATTA
Extraction de Connaissances LAtentes dans les Documents par une Analyse conjointe des Textes et des Tables
Identifier, extraire, structurer et stocker des connaissances sont des tâches majeures. Elles constituent des défis importants pour les organisations, en partie à cause de la dispersion des connaissances au sein de différents types de sources (e.g. bases de données, feuilles de calcul, documents textuels) et leur représentation hétérogène. Le projet ECLADATTA vise à tirer parti de cette complémentarité entre tables, textes et GCs pour proposer un processus capable de construire des corpus de textes et tables apparentés, et d’effectuer l’extraction conjointe des connaissances et leur réconciliation pour enrichir ou mettre à jour un GC.