
Para um estudo da formação do português brasileiro: descrição, representatividade e potencialidades do corpus colonial do CE-DOHS
Author(s) -
Lara da Silva Cardoso,
Zenaide de Oliveira Novais Carneiro,
Mariana Fagundes de Oliveira Lacerda
Publication year - 2021
Publication title -
laborhistórico
Language(s) - Portuguese
Resource type - Journals
ISSN - 2359-6910
DOI - 10.24206/lh.v7iespec.41843
Subject(s) - humanities , art , philosophy , history
Este artigo tem por objetivo apresentar o corpus colonial formado pelo CE-DOHS (Corpus Eletrônico de Documentos Históricos do Sertão). O CE-DOHS, ao longo de sete anos (2012-2018), elaborou um corpus diacrônico dos séculos XIX e XX, oferecendo dados em formato eletrônico para o estudo linguístico do português brasileiro (PB). A partir do corpus colonial, o CE-DOHS busca oferecer aos pesquisadores da história do Português Brasileiro um pequeno conjunto de textos representativos do cenário multilíngue e multiétnico do Brasil Colônia, mais especificamente dos séculos XVII e XVIII que, somado aos outros corpora, oferece, em um único banco, quatro séculos de dados linguísticos do português em solo brasileiro. O corpus em questão contém 151 documentos, escritos por 16 escreventes, todos nascidos no Brasil, e possui mais de dez gêneros textuais diferentes, que foram agrupados em pequenos acervos, conforme as etnias dos escreventes e os possíveis processos de aquisição da língua portuguesa. O objetivo da constituição do corpus é investigar a difusão do português na América e a dinâmica dessa língua no processo de surgimento do PB. Neste trabalho, serão enfatizadas: as estratégias para o encontro dos manuscritos, uma vez que a delimitação temporal estabelecida para o corpus é, ainda, obscura dentro dos estudos sobre o PB; a representatividade dos manuscritos, mostrando que, apesar de em pequena quantidade, são significativos; as potencialidades do material organizado, indicando alguns dos possíveis trabalhos linguísticos possíveis de serem realizados, explorando o corpus em diferentes áreas e/ou constituindo corpora maiores, capazes de fornecer mais dados sócio-históricos e linguísticos.