z-logo
open-access-imgOpen Access
Descrição Preliminar do Corpus DANTEStocks: Diretrizes de Segmentação para Anotação segundo Universal Dependencies
Author(s) -
Ariani Di Felippo,
Caroline Postali,
Gabriel Ceregatto,
Laura S. Gazana,
Emanuel H. da Silva,
Norton Trevisan Roman,
Thiago Alexandre Salgueiro Pardo
Publication year - 2021
Language(s) - Portuguese
Resource type - Conference proceedings
DOI - 10.5753/stil.2021.17813
Subject(s) - computer science
A anotação de textos informais segundo a Universal Dependencies requer dois processos de segmentação: delimitação da unidade relevante para a análise sintática e identificação das palavras sintáticas. Neste artigo, apresentam-se as idiossincrasias linguísticas do corpus DANTEStocks, composto por tweets do mercado financeiro, escritos em Português, e as estratégias gerais de segmentação automática. Assim, contribui-se para a descrição de aspectos linguísticos dos tweets e para o desenvolvimento de recursos e ferramentas de processamento automático desse subgênero de "user-generated content".

The content you want is available to Zendy users.

Already have an account? Click here to sign in.
Having issues? You can contact us here