Un enfoque basado en corpus para descubrir relaciones semánticas entre entidades nombradas
Palavras-chave:
lingüística de corpus, entidades nombradas, corpus lingüísticos, lingüística computacionalResumo
Introducción: El objetivo de este estudio es analizar un texto noticioso relacionado con la identidad cultural, que forma
parte de un corpus lingüístico etiquetado, con el fin de anotar las relaciones sintácticas y semánticas entre las entidades
nombradas en el texto. Materiales y métodos: Se presenta una clasificación de las relaciones semánticas establecidas entre
las entidades nombradas y cómo funcionan en un formato XML etiquetado, utilizando el etiquetado gramatical y el análisis
sintáctico. Se etiquetaron 20 entidades nombradas, 13 relaciones gramaticales y 36 relaciones semánticas. Resultados: La
propuesta presentada en este artículo resulta ser útil para desarrollar y evaluar nuevos sistemas abiertos de extracción
de información en español. Discusión: Los corpus lingüísticos, la lingüística de corpus y la lingüística computacional son
herramientas valiosas en el proceso de aprendizaje automático de las computadoras para entender el lenguaje natural. El
análisis de relaciones semánticas y sintácticas entre entidades nombradas en un texto noticioso es crucial para la extracción
de información relevante y la identificación de patrones lingüísticos. Conclusiones: Este estudio destaca la relevancia de los
corpus lingüísticos etiquetados y la lingüística de corpus en el análisis del lenguaje natural y en el desarrollo de sistemas
de procesamiento de lenguaje natural capaces de comprender y analizar el lenguaje humano en diferentes contextos.
La importancia de este trabajo radica en la necesidad de desarrollar sistemas de procesamiento de lenguaje natural que
permitan a las computadoras comprender y analizar el lenguaje humano en diferentes contextos.
Referências
Alonso, L. (1998). El análisis sociológico de los discursos: una aproximación desde los usos concretos. Ed. Fundamentos.
Análisis del Discurso. (2015). https://metodosdeinvestigaciondcgunefa.wordpress.com/2015/07/04/analisisdel-discurso/
Arredondo Toledo, L. M. (2018). Extracción de relaciones entre las entidades nombradas en el idioma español [Tesis de Maestría].
Bernal Chávez, J. A. y Hincapié Moreno, D. A. (2018). Lingüística de corpus. http://bibliotecadigital.caroycuervo.gov.co/1703/1/Linguistica-de-corpus-2018.pdf
Boillos Pereira, M. M. (2018). La elaboración de un corpus del profesorado de español (copele): ¿utopía o realidad? Disponible en: https://www.scielo.cl/scielo.php?script=sci_arttext&pid=S0718-48832018000200153
Cruz Piñol, M. (2017). Lingüística de corpus y enseñanza del español como 2/L. Arco/Libros. https://www.arcomuralla.com/detalle_libro.php?id=872
Culotta, A., & Sorensen, J. (2004). Dependency tree kernels for relation extraction. In Proceedings of the 42nd annual meeting on association for computational linguistics (p. 423). Association for Computational Linguistics.
Culotta, A., McCallum, A. & Betz, J. (2006). Integrating probabilistic extraction models and data mining to discover relations and patterns in text. In Proceedings of the main conference on Human Language Technology Conference of the North American Chapter of the Association of Computational Linguistics (pp. 296-303). Association for Computational Linguistics.
Filología e informática. (1999): nuevas tecnologías en los estudios filológicos (pp. 45-77). Milenio.
Jurafsky, D., & Martin, J. H. (2017). Vector Semantics. Speech and Language Processing: An Introduction to Natural Language Processing. Computational Linguistics, and Speech Recognition (3rd ed draft chapter 15-16).
Lyons, John. (1997). Semántica lingüística. Paidós.
Martín Peris, Ernesto. (coord.) (2008). Diccionario de términos clave de ELE. SGEL.
Mercado, H. (2008). Fundamentos de la lingüística de corpus. (s.e.).
Pardo Abril, N. G. (2002). El contexto y el discurso público. https://revistas.udistrital.edu.co/index.php/enunc/article/view/2465/3432.
Sinclair, J. M. (1991). Corpus, Concordance, Collocation. Oxford: Oxford University Press.
Torruela, J. & Llisterri, J. (1999). Diseño de corpus textuales y orales. En Filología e informática: nuevas tecnologías en los estudios filológicos (pp. 45-77). Milenio.
Wallis, S. and Nelson G. (s.f.). Knowledge discovery in grammatically analysed corpora. Data Mining and Knowledge Discovery, 5: 307–340.
Publicado
Como Citar
Edição
Seção
Licença
Copyright (c) 2023 Reynier Ávila Peña, Celia María Pérez Marqués
Este trabalho está licenciado sob uma licença Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.
Esta revista proporciona un acceso abierto inmediato a su contenido, basado en el principio de que ofrecer al público un acceso libre a las investigaciones ayuda a un mayor intercambio global de conocimiento. Cada autor es responsable del contenido de cada uno de sus artículos. Los artículos pueden ser inéditos o estar disponibles previamente en servidores de preprints reconocidos por la revista. Sin embargo, no se permite la duplicación de la publicación o traducción de un artículo ya publicado en otra revista o como capítulo de un libro.
This journal provides immediate open access to its content, based on the principle that providing the public with free access to research supports a greater global exchange of knowledge. Each author is responsible for the content of each of their articles. Articles may be previously unpublished or available on preprint servers recognized by the journal. However, duplication of publication or translation of an article already published in another journal or as a book chapter is not permitted.
Esta revista oferece acesso aberto imediato ao seu conteúdo, com base no princípio de que oferecer ao público acesso gratuito à pesquisa contribui para um maior intercâmbio global de conhecimento. Cada autor é responsável pelo conteúdo de cada um de seus artigos. Os artigos poderão ser inéditos ou estar previamente disponíveis em servidores de preprints reconhecidos pela revista. No entanto, não é permitida a duplicação de publicação ou tradução de artigo já publicado em outro periódico ou como capítulo de livro.