Apertura de la caja negra en sistemas de escucha de IA: Assemblages para arte, tecnología e innovación
Article Sidebar
Citaciones en Google Académico
Main Article Content
La caja negra de la innovación en el ámbito de las tecnologías de IA conectadas hace que no solo sus tecnicismos sean opacos sino también, y lo que es más importante, los efectos en la sociedad y las relaciones que constituyen su creación y mediación. Esto presenta una oportunidad para intervenciones creativas de artistas e investigadores, para desvelar las relaciones en red que forman parte de las tecnologías de IA y especular sobre sus efectos ontológicos. Este artículo quiere destapar todo lo relacionado con los sistemas de escucha de IA actualmente presentes en dispositivos ubicuos como asistentes de voz y altavoces inteligentes, e incorpora modelos computacionales de audición de máquinas. Al rastrear la investigación científica, la experiencia técnica y las relaciones sociales que han llevado a nuestra adopción cultural de los sistemas de escucha de IA, el artículo presenta un conjunto sociotécnico dentro del cual operan estas máquinas. Paralelamente, el artículo revela varios contextos para que artistas e investigadores en innovación se involucren con la complejidad sociotécnica de los sistemas de escucha de IA, al compartir algunas instancias de intervenciones creativas y artísticas que han intentado desvelar la naturaleza de sus assemblages.
Article Details
Esta obra está bajo una licencia internacional Creative Commons Atribución 4.0.
(c) Sharath Chandra Ramakrishnan, 2020
Derechos de autor
Los artículos publicados en Artnodes están sujetos a una licencia de Reconocimiento 4.0 Internacional de Creative Commons, el texto completo de la cual se puede consultar en http://creativecommons.org/licenses/by/4.0/; los autores retienen el copyright. Puede copiarlos, distribuirlos, comunicarlos públicamente, hacer obras derivadas y usos comerciales siempre que reconozca los créditos de las obras (autoría, nombre de la revista, institución editora) de la manera especificada por los autores o por la revista.
Es responsabilidad de los autores obtener los permisos necesarios de las imágenes que estén sujetas a copyright.
Cesión de derechos de propiedad intelectual
El autor cede en régimen no exclusivo a los editores de la revista los derechos de explotación (reproducción, distribución, comunicación pública y transformación) para explotar y comercializar la obra, entera o en parte, en todos los formatos y modalidades de explotación presentes o futuros, en todos los idiomas, por todo el periodo de vida de la obra y por todo el mundo.
Declaro que soy el autor original de la obra. Los editores quedan, por lo tanto, exonerados de cualquier obligación o responsabilidad por cualquier acción legal que pueda suscitarse derivada de la obra depositada por la vulneración de derechos de terceros, sean de propiedad intelectual o industrial, de secreto comercial o cualquier otro
Sharath Chandra Ramakrishnan, Escuela de Artes, Tecnología y Comunicación Emergente Universidad de Texas, Dallas
Sharath Chandra Ramakrishnan es un investigador híbrido en tecnología creativa y educador en los campos de ciencias cognitivas, interacción máquina-humano y política tecnológica. Es Director del Laboratorio cultural de señales que estudia las posibilidades creativas y las implicaciones tecnoculturales de las tecnologías de IA generalizadas, en sistemas de escucha humano-máquina. Como investigador de neurociencia cognitiva, ha estudiado las redes de cognición multimodal y auditiva en el procesamiento de sonido y lenguaje en el Instituto nacional de salud mental y neurociencia de Bangalore, India. Como radioaficionado con licencia (código: VU3HPA), extiende su práctica con sonido y señales en el espectro inalámbrico como artista de transmisión y señales. Sus estudios de doctorado en Arte y Tecnología buscan hacer contribuciones novedosas al campo de Estudios de sonido, cognición auditiva y sistemas de escucha, y antes de esto se especializó en IA y entornos virtuales interactivos en la Facultad de Informática de la Universidad de Edimburgo. Twitter: @AgentSpock
Bell, Alexander Graham, Lieut-Col Frank Bolton, and William Edward Lang- don. The Telephone: A Lecture Entitled Researches in Electric Telephony (Illustrated Edition). Echo Library, 2017.
Bentham, Jeremy. “The Panopticon.” In Offenders or Citizens?, edited by Philip Priestley and Maurice Vanstone, 28–30. London: Willan, 2012.
Bregman, Albert S. Auditory Scene Analysis. The MIT Press, 2001. https://doi.org/10.1016/B0-08-043076-7/00663-X
Brown, Guy J., and Martin Cooke. “Computational Auditory Scene Analysis.” Computer Speech and Language 8, no. 4 (1994): 297–336. https://doi.org/10.1006/csla.1994.1016
Cherry, Colin. “Cocktail Party Problem.” Journal of the Acoustical Society of America 25 (1953): 975–979.
Cox, Christopher. “The Alien’s Voice: Alvin Lucier’s North American Time Capsule.” In Mainframe Experimentalism: Early Computing and the Foundations of the Digital Arts. Berkeley: University of California Press, 2009.
Crawford, Kate, and Ryan Calo. 2016. “There is a blind spot in AI research.”
Nature 538, no. 7625 (2016): 311–313.
Deleuze, Gilles. Foucault. University of Minnesota Press, 1988.
Denbigh, Philip N., and J. Zhao. “Pitch extraction and separation of overlapping speech.” Speech Communication 11, nos. 2-3 (1992): 119–125.
Dudley, Homer, and Thomas H. Tarnoczy. “The Speaking Machine of Wolfgang von Kempelen.” The Journal of the Acoustical Society of America 22, no. 2 (1950): 151–166.
Ganchrow, Raviv. “Perspectives on Sound-Space: The Story of Acoustic Defense.” Leonardo Music Journal (2009): 71-75.https://doi.org/10.1121/1.1906583
Kittler, Friedrich. “Thinking colours and/or machines.” Theory, Culture & Society 23, nos 7-8 (2006): 39–50. https://doi.org/10.1177/0263276406069881
Latour, Bruno. We Have Never Been Modern. Harvard University Press, 2012.
Layton, Edward. “Conditions of technological development.” Science,
Technology, and Society (1977).
Luo, Yi, and Nima Mesgarani. 2018. “TasNet: time-domain audio separa- tion network for real-time, single-channel speech separation.” In 2018 IEEE International Conference on Acoustics, Speech and Signal Pro- cessing (ICASSP), 696–700. IEEE.
Mara, Mills. “Deaf Jam: From Inscription to Reproduction to Informa- tion.” Social Text 28 (2010): 35-58. https://doi.org/10.1215/01642472-2009-059
Mayr, Otto. “The science-technology relationship as a historiographic problem.” Technology and Culture 17, no. 4 (1976): 663–673.
Mellinger, David K. “Event Formation and Separation in Musical Sound.” PhD diss., Department of Computer Science, Stanford University, 1991.
Parsons, Thomas W. “Separation of speech from interfering speech by means of harmonic selection.” The Journal of the Acoustical Society of America 60, no. 4 (1976): 911–918.
Peters, John Durham. “Helmholtz, Edison, and Sound History.” In Memory Bytes: History, Technology, and Digital Culture, 177–198. Duke University Press, 2004.
Pickett, J. M. “Historical notes and preface.” American Annals of the Deaf 113, no.2 (March 1968): 117–119.
Pinch, Trevor J, and Wiebe E Bijker. “The social construction of facts and artefacts: Or how the sociology of science and the sociology of tech- nology might benefit each other.” Social Studies of Science 14, no. 3 (1984): 399– 441.
Price, Derek J. de Solla, Silvio A. Bedini, et al. “Automata in History.”
Technology and Culture 5, no. 1 (1964): 9–23.
Rice, Albert R. “The Android Clarinettist by Cornelis Jacobus van Oeckelen (1838).” Journal of the American Musical Instrumental Society 40 (2014): 163–189.
Riskin, Jessica. “The defecating duck, or, the ambiguous origins of artificial life.” Critical Inquiry 29, no. 4 (2003): 599–633. https://doi.org/10.1086/377722
Sabine, Wallace Clement, and M. David Egan. “Collected Papers on Acoustics.” The Journal of the Acoustical Society of America 95, no. 3679 (1994). https://doi.org/10.1121/1.409944
Sheets-Johnstone, Maxine. The Corporeal Turn: An Interdisciplinary Reader. Andrews UK Limited, 2015.
Sterne, Jonathan. The Audible Past: Cultural Origins of Sound Repro- duction. Duke University Press, 2003. https://doi.org/10.1215/9780822384250
Stubbs, Richard J., and Quentin Summerfield. “Algorithms for separat-ing the speech of interfering talkers: Evaluations with voiced sentences, and normal-hearing and hearing-impaired listeners.” The Journal of the Acoustical Society of America 87, no. 1 (1990): 359–372.
Taori, Rohan, Amog Kamsetty, Brenton Chu, and Nikita Vemuri. 2019. “Tar- geted Adversarial Examples for Black Box Audio Systems.” In 2019 IEEE Security and Privacy Workshops (SPW), 15–20. IEEE.
Tlalim, Tom. “Tonotopia: Co-designing sound art with hearing implant users: Podcast.” 2017.
Triandis, Harry C. The Analysis of Subjective Culture. New York: Wiley-Interscience, 1972.
Voskuhl, Adelheid. “Humans, machines, and conversations: An ethno- graphic study of the making of automatic speech recognition technolo- gies.” Social Studies of Science 34, no. 3 (2004): 393–421. https://doi.org/10.1177/0306312704043576
Weintraub, Mitchel. 1986. “A computational model for separating two si- multaneous talkers.” In ICASSP’86. IEEE International Conference on Acoustics, Speech, and Signal Processing 11:81–84. IEEE.
Wise, John Macgregor. Exploring Technology and Social Space Vol. 1.
Sage, 1997.
Zhang, Guoming, Chen Yan, Xiaoyu Ji, Tianchen Zhang, Taimin Zhang, and Wenyuan Xu. 2017. “DolphinAttack: Inaudible Voice Commands.” In Proceedings of the 2017 ACM SIGSAC Conference on Computer and Communications Security, 103–117. https://doi.org/10.1145/3133956.3134052
Artículos similares
- Marc Kosciejew, Documentación y materialización del arte: métodos conceptuales de documentación para la materialización de la información artística , Artnodes: Núm. 19: (Junio 2017). NODO 19. Futuros especulativos del arte (coord.: Ana Rodriguez Granell)
- Hortensia 1979 Mínguez García, Carles 1979 Méndez Llopis, De la electrografía a la gráfica expandida: una visión sobre la impresión digital hoy y sus procesos de hibridación , Artnodes: Núm. 32: (Julio 2023). NODO 32. Posibles III (coord.: Pau Alsina y Andrés Burbano)
- Ruth Pagès, El entorno del net art y su recepción: el proceso de apreciación de la obra de JODI , Artnodes: Núm. 4: (Julio 2005). NODO 4. Calculabilidad (coord.: Pau Alsina)
- Pau Waelder, Coleccionar intangibles: estrategias de venta de obras de net art , Artnodes: Núm. 13: (Noviembre 2013). NODO 13. Historia(s) del arte de los medios (coord.: Ana Rodríguez Granell, Pau Alsina)
- Eitan Mendelowitz, Entornos inteligentes y arte público , Artnodes: Núm. 26: (Julio 2020). NODO 26. IA, arte y diseño: Cuestionando el aprendizaje automático (coord.: A. Burbano y Ruth West)
- Augusto Zubiaga, Lourdes Cilleruelo, Juegos de emulación: marco ideológico para una arquitectura neuronal electrónica de inspiración biológica , Artnodes: Núm. 25: (Enero 2020). NODO 25. Diálogos entre Arte y Ciencia Fundamental (coord.: M. Bello y A. Gracie)
- Stanislav Milovidov, Políticas y limitaciones de acceso a las redes neuronales comerciales como incentivo al artivismo , Artnodes: Núm. 33: (Enero 2024). NODO 33. Artivismo mediático: sobre la arqueología y la historia de la cultura digital para el cambio social (coord.: Carolina Fernández-Castrillo y Diego Mantoan)
- Rafael Ortiz Martinez de Carnero, El cuerpo humano desde una perspectiva biotecnológica en contextos artísticos: espacio activo de experimentación en constante transformación , Artnodes: Núm. 32: (Julio 2023). NODO 32. Posibles III (coord.: Pau Alsina y Andrés Burbano)
- Florian Cramer, fotografía especulativa , Artnodes: Núm. 34: (Julio 2024). NODO 34. Materiología y variantología: invitación al diálogo (coord.: Siegfried Zielinski y Daniel Irrgang)
- Nuria Peist, Las obras de arte, las personas y los materiales. Un análisis fenomenológico y sistémico del arte actual. , Artnodes: Núm. 15: (Junio 2015). NODO 15. Art Matters I (coord.: Pau Alsina, Ana Rodríguez Granell)
<< < 1 2 3 4 5 6 7 8 9 10 > >>
También puede {advancedSearchLink} para este artículo.