El Procesamiento del Lenguaje Natural en la Recuperación de Información Textual y áreas afines
Article Sidebar
Citaciones en Google Académico
Main Article Content
El " Procesamiento del Lenguage Natural " (NLP) es una disciplina con una larga trayectoria. Nace en la década de 1960, como un subárea de la Inteligencia Artificial y la Lingüística, con el objeto de estudiar los problemas derivados de la generación y comprensión automática del lenguaje natural.
En sus orígenes, sus métodos tuvieron gran aceptación y éxito, no obstante, cuando sus aplicaciones fueron llevadas a la práctica, en entornos no controlados y con vocabularios genéricos, empezaron a surgir multitud de dificultades. Entre ellas, pueden mencionarse por ejemplo los problemas de polisemia y sinonimia.
En los últimos años, las aportaciones que se han hecho desde este dominio han mejorado sustancialmente, permitiendo el procesamiento de ingentes cantidades de información en formato texto con un grado de eficacia aceptable. Muestra de ello es la aplicación de estas técnicas como una componente esencial en los motores de búsqueda web, en las herramientas de traducción automática, o en la generación automática de resúmenes.
Este artículo tiene por objeto hacer una revisión de las principales características de las técnicas de procesamiento del lenguaje natural , centrándose en su aplicación a la recuperación de información y áreas afines [ Strzalkowski, 1999 ]. Concretamente, en el segundo apartado se estudiaran los diferentes fenómenos que dificultan el procesamiento automático del lenguaje natural; en el apartado tercero se describen las principales metodologías del NLP aplicadas en la recuperación de información; en el capítulo cuarto se enuncian diversos campos de investigación relacionados con la recuperación de información y el procesamiento del lenguaje natural; a continuación se presentan las conclusiones de este trabajo y, finalmente a modo de anexo (Anexo 1), mencionamos algunas de las peculiaridades del NLP en el caso concreto del castellano.
Article Details
Derechos de autor
Esta obra está publicada bajo una licencia Creative Commons Reconocimiento-NoComercial-SinObraDerivada 4.0 Internacional (CC BY-NC-ND 4.0)
Artículos más leídos del mismo autor/a
- Mari Vállez, Mario Pérez-Montoro, La comunicación periodística en tiempos de pandemia: análisis del tratamiento de la COVID-19 en la prensa europea , Hipertext.net: Núm. 21 (2020): COVID-19 y comunicación
- Lluís Codina, Rafael Pedraza, Javier Díaz Noci, Ruth Rodríguez-Martínez, Mario Pérez-Montoro, Víctor Cavaller-Reyes, Sistema Articulado de Análisis de Cibermedios (SAAC): Una propuesta sobre el qué y el cómo para estudiar medios de comunicación digitales , Hipertext.net: Núm. 12 (2014)
- Pere Freixa, Lluís Codina, Rafael Pedraza, Cristòfol Rovira, Presentación del número especial "COVID-19 y comunicación" y una nota a favor de la Ciencia Abierta , Hipertext.net: Núm. 21 (2020): COVID-19 y comunicación
- Mari Vàllez, Tesis doctoral – Síntesis. Exploración de procedimientos semiautomáticos para el proceso de indexación en el entorno web , Hipertext.net: Núm. 15 (2017): Medios digitales e interacción
- Mari Vállez, Cristòfol Rovira, Lluís Codina, Rafael Pedraza, Procedimientos para la extracción de palabras clave de páginas web basados en criterios de posicionamiento en buscadores , Hipertext.net: Núm. 8 (2010)
- Mari Vállez, Mari-Carmen Marcos, Las bibliotecas en un entorno Web 2.0 , Hipertext.net: Núm. 7 (2009)
- Ruth Rodriguez-Martinez, Rafael Pedraza, Prensa digital y Web 2.0 , Hipertext.net: Núm. 7 (2009)
- Mari Vállez, Carlos Lopezosa, Abordando el concepto de visibilidad web: qué es, de dónde viene y hacia dónde va , Hipertext.net: Núm. 28 (2024)