z-logo
open-access-imgOpen Access
Fragmentation et enrichissement de textes scientifique sus forme électronique
Author(s) -
Sylvie Lainé-Cruzel,
Éric Guinet
Publication year - 2000
Publication title -
document numérique
Language(s) - French
Resource type - Journals
SCImago Journal Rank - 0.101
H-Index - 6
eISSN - 1963-1014
pISSN - 1279-5127
DOI - 10.3166/dn.4.1-2.59-84
Subject(s) - fragmentation (computing) , chemistry , computer science , operating system
Les documents scientifiques electroniques sont fortement structures dans leur organisation discursive par des contraintes redactionnelles non totalement explicitees. Nous presentons ici une methode exploratoire visant a developper une expertise dans la reconnaissance d'indices textuels et d'indices de mise en forme caracteristiques d'une revue ou d'un type de support. Cette expertise sera exploitee a des fins d'identification d'elements utiles pour caracteriser le document au travers de metadonnees exploitables par des non-specialistes du domaine (profession de l'auteur, communaute de l'auteur…) et pour permettre le reperage de fragments caracteristiques du discours scientifique sur des criteres non relatifs aux themes abordes dans les documents (resume, objectif du travail, presentation de la methode, experimentation…). Le decoupage et l'enrichissement sont realises par le couplage d'une methode d'analyse statistique de donnees textuelles (Alceste) qui identifie des indices textuels et les structures en classes stables, et d'une analyse de la structure logique des documents.

The content you want is available to Zendy users.

Already have an account? Click here to sign in.
Having issues? You can contact us here
Accelerating Research

Address

John Eccles House
Robert Robinson Avenue,
Oxford Science Park, Oxford
OX4 4GP, United Kingdom