Métodos de la dialectología cuantitativa
Article Sidebar
Main Article Content
La introducción de la cuantificación de la variación geolingüística ha traído consigo un espectacular auge de las publicaciones sobre la materia, que indican una renovada vitalidad de la disciplina. Uno de los mayores avances de la dialectología del siglo pasado, la dialectometría, se ha convertido en una realidad en prácticamente todas las lenguas cultivadas (Goebl 1992; Nerbonne 2013). La variedad de técnicas cuantitativas utilizadas en la dialectología pone al alcance de los investigadores un amplio abanico de posibilidades de analizar los datos dialectales. Pero todo análisis cuantitativo necesita de una base de datos amplia que aleja al dialectólogo de las prácticas del denominado (single) feature based dialectología, ganando en la objetividad de la muestra del análisis. En este trabajo se presentan los pasos que hay que seguir para desarrollar una investigación en dialectología cuantitativa. Además, se exponen algunas de las técnicas utilizadas, como las destinadas a la cuantificación de la distancia entre variedades, a la clasificación jerárquica, y/o al análisis del continuum dialectal. Así mismo, también se exponen métodos multivariantes para la identificación de patrones de variación, estudio de las variables que presentan similares patrones geográficos, analizar la probabilidad de pertenencia a determinados grupos dialectales, etc. La metodología de la dialectología cuantitativa se halla delimitada por los siguientes pasos: elección de un atlas lingüístico del que se proveerá su base de datos (que puede ser fonética, ortográfica o/y etiquetada), aplicación de una medida de distancia que proporciona una matriz de distancias y el uso de técnicas cuantitativas aplicadas a la matriz de distancias. La cuantificación se ha convertido en un paso obligatorio para expertos que se dedican al estudio de la variación lingüística.
Article Details
Alvar, ed. Informática y Lingüística. Málaga: Ágora, pp. 107-119.
Atwood, E. Bagby. 1955. The phonological divisions of Belgo-Romance. Orbis IV:
367-389.
Aurrekoetxea, Gotzon. 1995. Bizkaieraren egituraketa geolinguistikoa. Bilbao:
UPV/EHU.
Aurrekoetxea, Gotzon. 2010. The correlation between morphological, syntactic and
phonological variation in the Basque language. En B. Heselwood y Cl. Upton, eds. Proceedings of Methods XIII. Papers from the Thirteenth International Conference on Methods in Dialectology, 2008. Frankfurt: Peter Lang, pp. 207-218.
Aurrekoetxea, Gotzon. 2016. Distantzia geografikoaren eta hizkuntza distantziaren
arteko korrelazioa. En G. Aurrekoetxea, J. M. Makazaga y P. Salaberri, eds. Txipi
Ormaetxea omenduz. Hire bordatxoan, Bilbao: UPV/EHU, pp. 55-72.
Aurrekoetxea, Gotzon; Clua, Esteve; Iglesias, Aitor; Usobiaga, Iker; Salicrú, Miquel.
2020. Characterizing dialect groups: distance and informativeness associated with
linguistic forms. Zeitschrift für Dialektologie und Linguistik 2020.2: 307-326.
DOI: 10.25162/zdl-2020-0011
Aurrekoetxea, Gotzon; Fernández-Aguirre, Karmele; Rubio, Jesús; Ruiz, Borja;
Sánchez, Jon. 2013. 'DiaTech': A New Tool for Dialectology. Literary and
Linguistic Computing 28.1: 23-30. DOI: 10.1093/llc/fqs049
Aurrekoetxea, Gotzon; Iglesias, Aitor; Clua, Esteve; Usobiaga, Iker; Salicrú, Miquel.
2020. Analysis of transitional areas in Dialectology: Approach with Fuzzy Logic.
Journal of Quantitative Linguistics. DOI: 10.1080/09296174.2020.1732765
Aurrekoetxea, Gotzon; Iglesias, Aitor; Santander, Gotzon; Usobiaga, Iker. 2016.
Diatech: tool for making dialectometry easier. Dialectologia 17: 1-22.
Aurrekoetxea, Gotzon; Abasolo, Juan; Clua, Esteve; Usobiaga, Iker; Salicrú, Miquel.
(En prensa). Hizkuntza-aldagaien aldakortasuna: lehen hurbilketa. Uztaro 118, 61-
79.
Aurrekoetxea, Gotzon; Nerbonne, John; Rubio, Jesús. 2020. Unifying analyses of
multiple responses. Dialectologia 25: 59-86.
Baiwir, Esther; Renders, Pascale. 2013. Les atlas linguistiques sont-ils des corpus?
Corpus 12: 27-37.
Chauveau, Jean-Pierre. 1985. Etude de cartes linguistiques par l'analyse factorielle des
correspondances. En A. Moll, eds. Actes del XVI CILFR (Ciutat de Mallorca, 7-12
d'abril de 1980), 2. Palma de Mallorca, pp. 379-397.
Cichocki, Wladyslaw. 1989. An application of dual scaling in Dialectometry. Journal of
English Linguistics 22.1: 91-95.
Clua, Esteve. 2010. Relevancia del análisis lingüístico en el tratamiento cuantitativo de la
variación dialectal. En G. Aurrekoetxea y J. L. Ormaetxea, eds. Tools for Linguistic
Variation. Bilbao: UPV/EHU, pp. 151-166.
Craenenbroeck, Jeroen van. 2014. Quantity and quality in linguistics-reverse
dialectometry. En Methods in Dialectology XV. August 11–15 4, 2014, Groningen,
the Netherlands.
https://static1.squarespace.com/static/5217e223e4b090faa01f8f2d/t/55a4e0eee4b0
d12431c376a2/1436868846371/project-phd.pdf
Davis, Alva L.; MacDavid, Raven I. 1950. A transition area. Language 26.2: 264-273.
Donoso, Gonzalo; Sánchez, David. 2017. Dialectometric analysis of language variation
in Twitter. En P. Nakov, M. Zampieri, N. Ljubešić, J. Tiedemann, S. Malmasi y A.
Ali, eds. Proceedings of the Fourth Workshop on NLP for Similar Languages,
Varieties and Dialects. Association for Computational Linguistics, pp. 16-25. DOI:
10.18653/v1/W17-12
Dubert-García, Francisco. 2020. O galego, unha lingua sen dialectos: olladas sociais e
lingüísticas sobre a variación dialectal. Estudios Románicos 29: 147-163.
EHHA: Euskaltzaindia. 2013. Euskararen Herri Hizkeren Atlasa. Vol. V. Bilbao:
Euskaltzaindia.
Elvira-García, Wendy; Balocco, Simone; Roseano, Paolo; Fernández-Planas, Ana
María. 2018. ProDis: A dialectometric tool for acoustic prosodic data. Speech
Communication 97: 9-18.
Embleton, Sheila. 1987a. A new technique for dialectometry. En V. B. Makkai, ed.
Twelfth LACUS Forum. Jupiter Press: Lake Bluff, Illinois.
Embleton, Sheila. 1987b. Multidimensional scaling as a dialectometrical technique. En
R. M. Babitch, ed. Papers from the Eleventh Annual Meeting of the Atlantic
Provinces Linguistic Association. New Brunswick: Centre Universitaire de
Shippagan in Shippagan, pp. 33-49.
Embleton, Sheila; Uritescu, Dorin; Wheeler, Eric S. 2013. Defining dialect regions with
interpretations: Advancing the multidimensional scaling approach. Literary and
Linguistic Computing 28.1: 13-22.
Fernández Planas, Ana María; Elvira-García, Wendy; Balocco, Simone; Roseano,
Paolo. 2019. Análisis dialectométrico con ProDis: un paso más en los estudios
prosódicos de AMPER. En J. Dorta, ed. Investigación geoprosódica. Amper:
análisis y retos. Madrid/Frankfurt am Main: Iberoamericana Vervuert, pp. 119-
135.
Fernández Rei, Francisco. 1990. Dialectoloxía da lingua galega. Vigo: Xerais.
García de Diego, Vicente. 1990. Elementos de gramática histórica gallega (fonéticamorfología). Burgos: Hijos de Santiago Rodríguez.
García de Diego, Vicente. 1959. Manual de dialectología española. Madrid: Ediciones
Cultura Hispánica.
García de Diego, Vicente. 1984. Elementos de gramática histórica gallega (FonéticaMorfología). Burgos, 1906.
Goebl, Hans. 1976. La dialectométrie appliquée à l'ALF (Normandie). En A. Várvaro, ed.
XIV Congresso internazionale di linguistica e filologia romanza. Atti., II.
Napoles/Amsterdam: G. Macchiaroli / J. Benjamins, pp. 165-195.
Goebl, Hans. 1983. Matrices, distances et interpoints. Etude dialectométrique sur les
isoglosses quantitatives. En Marie-Rose Simoni-Aurembou, ed. Cahier des Annales
de Normandie n°15. Dialectologie et littérature du domaine d'oïl occidental: actes
du colloque tenu à l'Université de Caen en février 1981 pp. 113-137. DOI:
10.3406/annor.1983.3899
Goebl, Hans. 1987. Points chauds de l'analyse dialectométrique: pondération et
visualisation. Revue de linguistique romane 51: 63-118.
Goebl, Hans. 1991. Una classificazione gerarchica di dati geolinguistici tratti dall'AIS.
Saggio di dialettometria dendrografica. Linguistica 31:341-351.
Goebl, Hans, 1992. Problèmes et méthodes de la dialectométrie actuelle (avec
application á l'ais). En G. Aurrekoetxea y X. Videgain, eds. Actas del congreso
internacional de dialectología. Bilbao: Euskaltzaindia, pp. 429-475.
Goebl, Hans. 2002. Analyse dialectométrique des structures de profondeur de l'ALF.
Revue de linguistique romane 66: 5-63.
Goebl, Hans. 2005. La dialectométrie corrélative: un nouvel outil pour l’étude de
l’aménagement dialectal de l’espace par l’homme. Revue de linguistique romane
69: 321-367.
Goebl, Hans. 2006. Recent advances in Salzburg Dialectometry. Literary and Linguistic
Computing 21.4: 411-435.
Goebl, Hans. 2010. Introducción a los problemas y métodos según los principios de la
Escuela Dialectométrica del Salzburgo (con ejemplos sacados del “Atlante italo-Svizzero” AIS). En G. Aurrekoetxea y J. L. Ormaetxea, eds. Tools for linguistic variation. Bilbao: UPV/EHU. Anejos del Seminario de Filología Vasca Julio Urquijo LIII, pp. 3-39.
Goebl, Hans. 2013. La dialectometrización del ALPI: rápida presentación de los
resultados. En E. Casanova Herrero y C. Calvo Rigual, eds. Actas del XXVI
Congreso Internacional de Lingüística y de Filología Románicas (Valencia 2010).
Berlin/Boston: Walter de Gruyter, vol. VI, pp. 143-154.
Goebl, Hans; Smečka, Pavel. 2016. The quantitative nature of working maps (WM) and
taxatorial areas (TA). A brief look at two basic units of Salzburg Dialectometry
(S-DM). Studies in Quantitative Linguistics 23. Issues in Quantitative Linguistics
4: 11-127.
Gonçalves, Bruno; Sánchez, David. 2016. Learning about Spanish dialects through
Twitter. RILI XVI-2: 65-75.
Gooskens, Charlotte. 2005. Traveling time as a predictor of linguistic distance.
Dialectologia et Geolinguistica 13: 38-62.
Grieve, Jack; Jurgens, David. 2019. Mapping word frequencies on Twitter using R and
Python. En Workshop presented at NWAV 48, University of Oregon, 2019-10-10.
http://jurgens.people.si.umich.edu/tutorials/Mapping_Word_Frequencies_on_Twit
ter_using_Python.html
Grieve, Jack; Speelman, Dirk; Geeraerts, Dirk. 2011. A statistical method for the
identification and aggregation of regional linguistic variation. Language Variation
and Change 23: 1-29.
Guiter, Henri. 1973. Atlas et frontières linguistiques. En G. Straka y P. Gardette, eds.
Les dialectes de France à la lumire des atlas régionaux (Colloque de Strasbourg,
1971). Paris: CNRS, pp. 61-109.
Houck, Charles L. 1967. A computerized statistical methodology for linguistic
geography: a pilot study. Folia linguistica 1.1-2: 80-95.
Hyvönen, Saara; Leino, Antti; Salmenkivi, Marko. 2007. Multivariate analysis of
Finnish dialect data – An overview of lexical variation. Literary and Linguistic
Computing 22.3: 271-290.
Inoue, Fumio. 2004. Multivariate analysis, geographical gravity centers and the history
of the standard Japanese forms. Area and Culture Studies 68: 15-36.
Jeszenszky, Péter; Stoeckle, Philipp, Glaser, Elvira; Weibel, Robert. 2018. A gradient
perspective on modeling interdialectal transitions. Journal of linguistic geography
6.2: 78-99.
Kessler, Brett. 1995. Computational dialectology in Irish Gaelic. En Proceeding of the
European ACL. Dublin: ACL, 60-67.
Kretzschmar, William. 1992. Isoglosses and predictive modeling. American Speech 67:
227-249.
Kretzschmar, William A. 1996. Quantitative areal analysis of dialect features. Language
Variation and Change 8: 13-39.
Leinonen, Therese. 2008. Factor analysis of vowel pronunciation in Swedish dialects.
International Journal of Humanities and Arts Computing 2.1-2: 189-204.
Meschenmoser, Daniel; Pröll, Simon. 2012. Using fuzzy clustering to reveal recurring
spatial patterns in corpora of dialect maps. International Journal of Corpus
Linguistics 17: 176-197.
Mucha, Hans Joachim; Haimerl, Edgar. 2005. Automatic validation of hierarchical
cluster analysis with application in Dialectometry. En C. Weihs y W. Gaul, eds. Classification—the ubiquitous challenge. Proc. of 28th Mtg Gesellschaft für Klassifikation, Dortmund, Mar. 9-11, 2004. Berlin: Springer, pp. 513-520.
Nerbonne, John. 2010. Mapping aggregate variation. En A. Lameli, R. Kehrein y S.
Rabanus, eds. Language and space. International handbook of linguistic
variation. Vol. 2. Berlin: De Gruyter Mouton, pp. 476-495.
Nerbonne, John; Colen, Rinke; Gooskens, Charlotte.; Kleiweg, Peter; Leinonen,
Therese. 2011. Gabmap – a web application for Dialectology. Dialectologia
Special issue II: 65-89.
Nerbonne, John; Heeringa, Wilbert. 2007. The geographic distribution of linguistic
variation. Studies in generative grammar: 267-298.
https://www.lingexp.unituebingen.de/sfb441/LingEvid2006/abstracts/nerbonne.pdf
Nerbonne, John; Heeringa, Wilbert. 2010. Measuring dialect dierences. En P. Auer y J.
E. Schmidt. eds. Theories and Methods, Vol.1. Berlin, New York: De Gruyter
Mouton, pp. 550-567.
Nerbonne, John; Kleiweg, Peter; Manni, Franz; Heeringa, Wilbert. 2008. Projecting
dialect distances to Geography: Bootstrap clustering vs. noisy clustering. En Ch.
Preisach, H. Burkhardt, L. Schmidt-Thieme y R. Decker, eds. Data analysis,
machine learning and applications. Proceedings of the 31st Annual Conference of
the Gesellschaft für Klassifikation e.V., Albert-Ludwigs-Universität Freiburg,
March 7–9, 2007. Berlin / Heidelberg: Springer, pp. 647-654.
Nerbonne, John. 2006. Identifying linguistic structure in aggregate comparison. Literary
and Linguistic Computing 21.4: 463-475.
Nerbonne, John. 2009. Data-Driven Dialectology. Language and Linguistics Compass
3.1: 175-198. DOI: 10.1111/j.1749-818X.2008.00114.x
Nerbonne, John. 2013. How much does Geography influence language variation? En P.
Auer, M. Hilpert, A. Stukenbrock y B. Szmrecsanyi, eds. Space in Language and
Linguistics. Geographical, Interactional, and Cognitive Perspectives. Berlin: De
Gruyter, pp. 220-236.
Nerbonne, John; Prokić, Jelena; Wieling; Martijn; Gooskens, Charlotte. 2010. Some
further dialectometrical steps. En G. Aurrekoetxea y J. L. Ormaetxea, eds. Tools for
Linguistic Variation. Bilbo: UPV/EHU, pp. 41-56.
Nerbonne, John; Wieling, Martin. 2018. Statistics for aggregate variationist analyses. En
Ch. Boberg, J. Nerbonne y D. Watt, eds. The handbook of Dialectology. Oxford:
John Wiley & Sons, pp. 400-414.
Philps, Dennis. 1984. Dialectométrie automatique. En H. Goebl, ed. Dialectology, Série
Quantitative Linguistics 21. Bochum: Dr. Brockmeyer, pp. 275-296.
Pickl, Simon; Rumpf, Jonas. 2012. Dialectometric concepts of space: Towards a
variant-based dialectometry. En S. Hansen, Ch. Schwarz, Ph. Stoeckle y T. Streck,
eds. Dialectological and folk dialectological concepts of space. Current methods
and perspectives in Sociolinguistic research on dialect change, Series: linguae &
litterae, 17, Berlin/Boston: De Gruyter, pp. 199-214. DOI:
10.1515/9783110229127
Prokić, Jelena; Nerbonne, John. 2008. Recognizing groups among dialects.
International Journal of Humanities and Arts Computing 2.1-2: 153-172.
Pröll, Simon. 2013. Detecting structures in linguistic maps ̶Fuzzy clustering for pattern
recognition in geostatistical dialectometry. Literary and Linguistic Computing
28.1: 108-118.
Rama, Taraka y Çöltekin, Çağri. 2016. LSTM autoencoders for dialect analysis. Proceedings of the Third Workshop on NLP for Similar Languages, Varieties and
Dialects, Osaka, Japan: The COLING 2016 Organizing Committee, pp. 25-32.
Reed, David W.; Spicer, John L. 1952. Correlation methods of comparing idiolects in a
transition area. Language 28: 348-359.
Ruiz-Tinoco, Antonio. 2018. Geocorpus del español de las redes sociales y cartografía
automática. Monográficos SINOELE 17: 598-608.
Sanada, Shinji. 2010. The “glottogram”: A geolinguistic tool developed in Japan.
Dialectologia. Special issue I: 185-196.
Schneider, Edgar W. 1988. Qualitative vs. quantitative methods of area delimitation in
dialectology: A comparison based on lexical data from Georgia and Alabama.
Journal of English Linguistics 21: 175-212.
Séguy, Jean. 1971. La relation entre la distance spatiale et la distance lexicale. Revue de
Linguistique Romane 35: 335-357.
Séguy, Jean. 1973a. La dialectométrie dans l'atlas linguistique de la Gascogne. Revue de
Linguistique Romane 37: 1-24.
Séguy, Jean. 1973b. Atlas linguistique de la Gascogne. Complément du volume VI.
Paris: CNRS.
Shackleton, Robert G. Jr. 2005. English-American speech relationships: A quantitative
approach. Journal of English Linguistics 33: 99-160.
Shaw, David, 1974. Statistical analysis of dialectal boundaries. Computers and the
Humanities 8.3: 173-177.
Spruit, Marco René; Heeringa, Wilbert; Nerbonne, John. 2008. Associations among
linguistic levels. Lingua, special issue on Syntactic databases. Selected papers
presented in the special session Comparing Aggregate Syntaxes, Digital
Humanities conference, Paris, July 6, 2006: 65-90.
Szmrecsanyi Benedikt. 2012. Geography is overrated. En S. Hansen, C. Schwarz, P.
Stoeckle y T. Streck, eds. Dialectological and folk dialectological concepts of
space. Berlin: de Gruyter, Walter GmbH & Co., pp. 215-231.
Ueda, Hiroto. 2017. Two statistical treatments of Spanish vocabulary: Composite
indices of frequency and dispersion and principal component analysis applied to
ordinal frequencies. Dialectología, Special Issue VII: 187-227.
Valls, Esteve; Nerbonne, John; Prokić, Jelena; Wieling, Martin; Clua, Esteve; Lloret, MRosa. 2012. Applying the Levenshtein distance to Catalan dialects: A brief
comparison of two dialectometric approaches. Verba 39: 35-61.
Wieling, Martijn; Nerbonne, John. 2009. Bipartite spectral graph partitioning to cocluster varieties andsound correspondences in dialectology. En M. Choudhury, S.
Hassan, A. Mukherjee y S. Muresan, eds. Proceedings of the 2009 Workshop on
Graph-based Methods for Natural Language Processing. Suntec, Singapore:
Association for Computational Linguistics, pp. 26-34.
Wieling, Martijn; Nerbonne, John. 2010. Hierarchical spectral partitioning of bipartite
graphs to cluster dialects and identify distinguishing features. En Proceedings of
the 2010 Workshop on Graph-based Methods for Natural Language Processing,
ACL, Uppsala, Sweden, July 16, 2010, Stroudsbourg: Association for
Computational Linguistics, pp. 33-41.
Wieling, Martijn; Nerbonne, John. 2011. Bipartite spectral partitioning for clustering
dialect varieties and detecting their linguistic features. Computer Speech and
Language 25.3: 700-715.
Wieling, Martijn; Montemagni, Simonetta. 2016. Infrequent forms: Noise or not? En M.-H. Côté, R. Knooihuizen, J. Nerbonne, eds. The future of dialects: Selected
papers from methods in Dialectology XV. Berlin: Language Science press, pp.
215-223.
Zamora Vicente, Alonso. 1953. De geografía dialectal: -ao, -an en gallego. Nueva
revista de filología hispánica VII. 1-2: 73-80.