Approche statistique versus approche linguistique pour l'indexation sémantique des documents multilingues
Author(s) -
Loïc Maisonnasse,
Catherine Roussey,
Sylvie Calabretto,
Farah Harrathi
Publication year - 2011
Publication title -
document numérique
Language(s) - French
DOI - 10.3166/dn.14.2.193-214
RÉSUMÉ. Dans cet article nous présentons une approche statistique d’ indexation sémantique des documents multili ngues. L’approche que nous proposons est composée de trois étapes : extraction des termes, détection des concepts et détection des relations à partir des couples de concepts. Notre approche est validée par un ensemble d’expérimentations sur la collection ImageCLEFmed 2007 et une comparaison avec une approche linguistique. Nous montrons ainsi que l’approche statistique obtient des résultats équivalents à l’approche linguistique sans adapter la phase d’ indexation à la langue du document.
Accelerating Research
Robert Robinson Avenue,
Oxford Science Park, Oxford
OX4 4GP, United Kingdom
Address
John Eccles HouseRobert Robinson Avenue,
Oxford Science Park, Oxford
OX4 4GP, United Kingdom