
Générer un jeu de données structuré à partir d’un texte océrisé
Author(s) -
J. M. Crump
Publication year - 2021
Publication title -
the programming historian en français
Language(s) - French
Resource type - Journals
ISSN - 2631-9462
DOI - 10.46430/phfr0020
Subject(s) - humanities , art
Ce tutoriel présente des stratégies pour traiter la sortie OCR brute issue d’un texte scanné, l’analyser afin d'isoler et de corriger les éléments essentiels des métadonnées, et générer un ensemble de données structuré (un dictionnaire Python) à partir de celle-ci.