Un modèle de mixture de modèles génératifs pour les documents structurés multimédias. Application à la classification de documents XML et HTML
Author(s) -
Ludovic Denoyer,
Patrick Gallinari
Publication year - 2004
Publication title -
document numérique
Language(s) - French
Resource type - Journals
SCImago Journal Rank - 0.101
H-Index - 6
eISSN - 1963-1014
pISSN - 1279-5127
DOI - 10.3166/dn.8.3.35-54
Subject(s) - computer science , mod , physics , artificial intelligence
Nous presentons un modele general permettant la classification supervisee de documents structures multimedias. Nous proposons un modele generatif base sur les reseaux bayesiens afin de modeliser les documents de type XML ou HTML. Nous etudions une extension de ce modele generatif en modele discriminant a l'aide du formalisme des noyaux de Fisher. Enfin, nous testons notre modele sur trois grands corpus de documents.
Accelerating Research
Robert Robinson Avenue,
Oxford Science Park, Oxford
OX4 4GP, United Kingdom
Address
John Eccles HouseRobert Robinson Avenue,
Oxford Science Park, Oxford
OX4 4GP, United Kingdom