z-logo
open-access-imgOpen Access
Szerzőazonosítás Jacob és Wilhelm Grimm zajos, digitalizált levelezésében
Author(s) -
Greta Franzini,
Mike Kestemont,
Gabriela Rotari,
Melina Jander,
Jeremi K. Ochab,
Elio Franzini,
Joanna Byszuk,
Jan Rybicki
Publication year - 2021
Publication title -
digitális bölcsészet
Language(s) - Hungarian
Resource type - Journals
ISSN - 2630-9696
DOI - 10.31400/dh-hun.2021.5.3144
Subject(s) - physics , theology , combinatorics , humanities , stereochemistry , philosophy , mathematics , chemistry
Az alábbi cikk egy multidiszciplináris projekt eredményeit mutatja be, amely a különböző digitalizációs stratégiák számítógépes szöveganalízisben való használhatóságát járja körül. Pontosabban Jacob és Wilhelm Grimm szerzőségének automatizált megkülönböztetésére tettünk kísérletet, melyet egy HTR (HandwrittenText Recognition – kézzel írott szöveg felismerése) és OCR (Optical Character Recognition – optikai karakterfelismerés) által feldolgozott levelezéskorpuszban hajtottunk végre, korrekció nélkül – felmérve, hogy az így keletkezett zaj milyen hatással van a fivérek különböző írásmódjának azonosítására. Összegezve,úgy tűnik, hogy az OCR megbízható helyettesítője lehet a manuális átírásnak, legalábbis a szerzőazonosítás kérdéskörét illetően. Eredményeink továbbá abba az irányba mutatnak, miszerint még a különböző digitalizációs eljárásokból származó tanító- és tesztkorpuszok (training and test set) is használhatók a szerzőazonosítás során. A HTR-t tekintve a kutatás azt demonstrálja, hogy ez az automatizált átírás ugyan az OCR-hez képest szignifikánsan növeli a szövegek félrecsoportosításának veszélyét, ám körülbelül 20% feletti tisztaság már önmagában elegendő ahhoz, hogy a véletlennél nagyobb esélye legyen a helyes binárismegfeleltetésnek.

The content you want is available to Zendy users.

Already have an account? Click here to sign in.
Having issues? You can contact us here