Descrição Preliminar do Corpus DANTEStocks: Diretrizes de Segmentação para Anotação segundo Universal Dependencies | Zendy

Ariani Di Felippo | Zendy; Caroline Postali | Zendy; Gabriel Ceregatto | Zendy; Laura S. Gazana | Zendy; Emanuel H. da Silva | Zendy; Norton Trevisan Roman | Zendy; Thiago Alexandre Salgueiro Pardo | Zendy

AI Assistant Blog Pricing

Home ZAIA Blog

Open Access

Descrição Preliminar do Corpus DANTEStocks: Diretrizes de Segmentação para Anotação segundo Universal Dependencies

Author(s) -

Ariani Di Felippo,

Caroline Postali,

Gabriel Ceregatto,

Laura S. Gazana,

Emanuel H. da Silva,

Norton Trevisan Roman,

Thiago Alexandre Salgueiro Pardo

Publication year - 2021

Language(s) - Portuguese

Resource type - Conference proceedings

DOI - 10.5753/stil.2021.17813

Subject(s) - computer science

A anotação de textos informais segundo a Universal Dependencies requer dois processos de segmentação: delimitação da unidade relevante para a análise sintática e identificação das palavras sintáticas. Neste artigo, apresentam-se as idiossincrasias linguísticas do corpus DANTEStocks, composto por tweets do mercado financeiro, escritos em Português, e as estratégias gerais de segmentação automática. Assim, contribui-se para a descrição de aspectos linguísticos dos tweets e para o desenvolvimento de recursos e ferramentas de processamento automático desse subgênero de "user-generated content".

The content you want is available to Zendy users.

Already have an account? Click here to sign in.

Having issues? You can contact us here

Accelerating Research