El etiquetado de frases del kumauni después de modificar el algoritmo de earley’s

Main Article Content

Rakesh Pandey
Hoshiyar S. Dhami
La lengua kumauni es una de las lenguas regionales de la India, hablada en el área de Kumaun en la región del Himalaya. Puesto que esta lengua ha sido muy poco estudiada, en este trabajo se ha pretendido desarrollar una herramienta de etiquetado útil para los estudios sobre el kumauni. El objetivo final es contribuir a desarrollar una técnica para la comprobación de de las estructuras gramaticales en las oraciones del kumauni. Con esta finalidad, se ha escogido un conjunto de oraciones preexistentes del kumauni y a partir de ellas se han derivado reglas gramaticales. Además de esta selección, se ha intentado elegir aquellas oraciones que se usan actualmente y que son representativas de las posibles etiquetas en que pueden marcarse partes del habla. Esta elección se ha realizado para asegurar que en las oraciones aparezcan todas las etiquetas posibles. Las reglas derivadas de la gramática del Kumauni se han convertido a un modelo gramatical mediante el uso del algoritmo de Earley’s previamente modificado. El modelo matemático desarrollado se ha verificado aplicándolo a un conjunto separado de oraciones preexistentes del Kumauni. Este modelo puede usarse para etiquetar nuevas oraciones del kumauni, ofreciendo a los investigadores una nueva herramienta de etiquetaje.
Palabras clave
Kumauni Language, Context-free Grammar, Earley’s Algorithm, Natural Language Processing, Parsing, lengua kumauni, gramática libre de contexto, algoritmo de Earley’s, Procesamiento del lenguaje natural, etiquetado

Article Details

Cómo citar
Pandey, Rakesh; y Dhami, Hoshiyar S. «El etiquetado de frases del kumauni después de modificar el algoritmo de earley’s». Dialectologia: revista electrònica, n.º 7, pp. 75-92, https://raco.cat/index.php/Dialectologia/article/view/247909.