Apprentissage d'un espace de concepts de mots pour une nouvelle représentation des données textuelles | Zendy

Youngmin Kim | Zendy; Jean-François Pessiot | Zendy; Massih-Réza Amini | Zendy; Patrick Gallinari | Zendy

AI Assistant Blog Pricing

Home ZAIA Blog

Open Access

Apprentissage d'un espace de concepts de mots pour une nouvelle représentation des données textuelles

Author(s) -

Youngmin Kim,

Jean-François Pessiot,

Massih-Réza Amini,

Patrick Gallinari

Publication year - 2010

Publication title -

document numérique

Language(s) - French

Resource type - Journals

SCImago Journal Rank - 0.101

H-Index - 6

eISSN - 1963-1014

pISSN - 1279-5127

DOI - 10.3166/dn.13.1.63-82

Subject(s) - humanities , espace , philosophy , art

National audienceDans cet article nous proposons une technique à base d'apprentissage non supervisé pour la réduction de dimension des données textuelles. Cette technique est basée sur l'hypothèse que les termes co-occurrant dans les mêmes documents avec les mêmes fréquences sont sémantiquement proches. Suivant cette hypothèse les termes sont d'abord regroupés avec une version classifiante de l'algorithme EM (CEM). Les documents sont ensuite représentés dans l'espace de ces groupes de termes. Nous généralisons cette approche en étendant l'algorithme PLSA pour un partitionnement simultané des termes et des documents. Nous montrons dans une dernière étape la validité de notre approche en comparant le résultat de ce clustering avec ceux obtenus dans l'espace sac de mots initial et l'espace des groupes de mots induit par l'algorithme PLSA sur les trois collections de documents Reuters, 20newsgroups et WebKB

The content you want is available to Zendy users.

Already have an account? Click here to sign in.

Having issues? You can contact us here

Accelerating Research