Un enfoque basado en corpus para descubrir relaciones semánticas entre entidades nombradas

Autores/as

  • Reynier Ávila Peña Empresa de desarrollo de aplicaciones, tecnología y sistemas (Datys), Cuba
  • Celia María Pérez Marqués Universidad de Oriente, Cuba

Palabras clave:

lingüística de corpus, entidades nombradas, corpus lingüísticos, lingüística computacional

Resumen

Introducción: El objetivo de este estudio es analizar un texto noticioso relacionado con la identidad cultural, que forma
parte de un corpus lingüístico etiquetado, con el fin de anotar las relaciones sintácticas y semánticas entre las entidades
nombradas en el texto. Materiales y métodos: Se presenta una clasificación de las relaciones semánticas establecidas entre
las entidades nombradas y cómo funcionan en un formato XML etiquetado, utilizando el etiquetado gramatical y el análisis
sintáctico. Se etiquetaron 20 entidades nombradas, 13 relaciones gramaticales y 36 relaciones semánticas. Resultados: La
propuesta presentada en este artículo resulta ser útil para desarrollar y evaluar nuevos sistemas abiertos de extracción
de información en español. Discusión: Los corpus lingüísticos, la lingüística de corpus y la lingüística computacional son
herramientas valiosas en el proceso de aprendizaje automático de las computadoras para entender el lenguaje natural. El
análisis de relaciones semánticas y sintácticas entre entidades nombradas en un texto noticioso es crucial para la extracción
de información relevante y la identificación de patrones lingüísticos. Conclusiones: Este estudio destaca la relevancia de los
corpus lingüísticos etiquetados y la lingüística de corpus en el análisis del lenguaje natural y en el desarrollo de sistemas
de procesamiento de lenguaje natural capaces de comprender y analizar el lenguaje humano en diferentes contextos.
La importancia de este trabajo radica en la necesidad de desarrollar sistemas de procesamiento de lenguaje natural que
permitan a las computadoras comprender y analizar el lenguaje humano en diferentes contextos.

Citas

Alonso, L. (1998). El análisis sociológico de los discursos: una aproximación desde los usos concretos. Ed. Fundamentos.

Análisis del Discurso. (2015). https://metodosdeinvestigaciondcgunefa.wordpress.com/2015/07/04/analisisdel-discurso/

Arredondo Toledo, L. M. (2018). Extracción de relaciones entre las entidades nombradas en el idioma español [Tesis de Maestría].

Bernal Chávez, J. A. y Hincapié Moreno, D. A. (2018). Lingüística de corpus. http://bibliotecadigital.caroycuervo.gov.co/1703/1/Linguistica-de-corpus-2018.pdf

Boillos Pereira, M. M. (2018). La elaboración de un corpus del profesorado de español (copele): ¿utopía o realidad? Disponible en: https://www.scielo.cl/scielo.php?script=sci_arttext&pid=S0718-48832018000200153

Cruz Piñol, M. (2017). Lingüística de corpus y enseñanza del español como 2/L. Arco/Libros. https://www.arcomuralla.com/detalle_libro.php?id=872

Culotta, A., & Sorensen, J. (2004). Dependency tree kernels for relation extraction. In Proceedings of the 42nd annual meeting on association for computational linguistics (p. 423). Association for Computational Linguistics.

Culotta, A., McCallum, A. & Betz, J. (2006). Integrating probabilistic extraction models and data mining to discover relations and patterns in text. In Proceedings of the main conference on Human Language Technology Conference of the North American Chapter of the Association of Computational Linguistics (pp. 296-303). Association for Computational Linguistics.

Filología e informática. (1999): nuevas tecnologías en los estudios filológicos (pp. 45-77). Milenio.

Jurafsky, D., & Martin, J. H. (2017). Vector Semantics. Speech and Language Processing: An Introduction to Natural Language Processing. Computational Linguistics, and Speech Recognition (3rd ed draft chapter 15-16).

Lyons, John. (1997). Semántica lingüística. Paidós.

Martín Peris, Ernesto. (coord.) (2008). Diccionario de términos clave de ELE. SGEL.

Mercado, H. (2008). Fundamentos de la lingüística de corpus. (s.e.).

Pardo Abril, N. G. (2002). El contexto y el discurso público. https://revistas.udistrital.edu.co/index.php/enunc/article/view/2465/3432.

Sinclair, J. M. (1991). Corpus, Concordance, Collocation. Oxford: Oxford University Press.

Torruela, J. & Llisterri, J. (1999). Diseño de corpus textuales y orales. En Filología e informática: nuevas tecnologías en los estudios filológicos (pp. 45-77). Milenio.

Wallis, S. and Nelson G. (s.f.). Knowledge discovery in grammatically analysed corpora. Data Mining and Knowledge Discovery, 5: 307–340.

Publicado

2023-10-25

Cómo citar

Ávila Peña, R., & Pérez Marqués, C. M. (2023). Un enfoque basado en corpus para descubrir relaciones semánticas entre entidades nombradas. Maestro Y Sociedad, 23–31. Recuperado a partir de https://maestroysociedad.uo.edu.cu/index.php/MyS/article/view/6197

Número

Sección

Número Especial