
Automatización del análisis sintáctico para el español con el fin de crear in treebank estandarizado
Author(s) -
Minor Sandí Salazar,
Gabriela Marín Raventós,
Edgar Casasola
Publication year - 2017
Publication title -
káñina
Language(s) - Spanish
Resource type - Journals
eISSN - 2215-2636
pISSN - 0378-0473
DOI - 10.15517/rk.v40i4.30232
Subject(s) - humanities , philosophy , treebank , computer science , artificial intelligence , parsing
El crecimiento exponencial en la creación de documentos en la Internet, escritos en español, ofrece variadas oportunidades para el análisis de texto. Debido a su cantidad creciente y a la escasez de herramientas que colaboren en estos procesos, se hace imprescindible la creación de herramientas que los automaticen. Entre estas herramientas los treebanks ocupan un papel destacado, puesto que proveen información clave para muchos de los procesos de análisis. Actualmente, existe una tendencia que intenta estandarizar el etiquetado morfológico y sintáctico para crear puntos de contacto entre treebanks de distintas investigaciones. A partir de los antecedentes relacionados con el análisis sintáctico de textos, esta investigación propone una metodo- logía para determinar hasta dónde es posible automatizar el proceso de creación de treebanks, limitándose a la lengua española.