Unlocking the Black Box of AI Listening Machines: Assemblages for Art, Technology and Innovation

Sharath Chandra Ramakrishnan

doi:10.7238/a.v0i26.3362

PDF (English) ePUB (English)

Citacions a Google Acadèmic

DOI: https://doi.org/10.7238/a.v0i26.3362

Sharath Chandra Ramakrishnan

Escola d’Arts, Tecnologia i Comunicació Emergent Universitat de Texas, Dallas

https://orcid.org/0000-0001-7984-9442

La caixa negra de la innovació en l’àmbit de les tecnologies d’IA connectades fa que no solament els seus tecnicismes siguin opacs, sinó també, i cosa que és més important, els efectes en la societat i les relacions que constitueixen la seva creació i mediació. Això presenta una oportunitat per a les intervencions creatives dels artistes i investigadors, a fi de revelar les relacions en xarxa que formen part de les tecnologies d’IA i especular sobre els seus efectes ontològics. Aquest article vol destapar tot el relacionat amb els sistemes d’escolta d’IA, actualment presents en dispositius ubics com assistents de veu i altaveus intel·ligents, i incorpora models computacionals d’audició de màquines. Quan rastreja la recerca científica, l’experiència tècnica i les relacions socials que han portat a la nostra adopció cultural dels sistemes d’escolta d’IA, l’article presenta un conjunt sociotècnic dins del qual operen aquestes màquines. Paral·lelament, l’article revela diversos contextos perquè artistes i investigadors en innovació s’involucrin en la complexitat sociotècnica dels sistemes d’escolta d’IA, atès que comparteixen algunes instàncies d’intervencions creatives i artístiques que han intentat revelar la naturalesa dels seus assemblages.

Paraules clau

agents intel·ligents, art i disseny computacional, sistemes d’escolta, sistemes sociotècnics, anàlisi d’escenes auditives

Com citar

Ramakrishnan, Sharath Chandra. “Obertura de la caixa negra en sistemes d’escolta d’IA: assemblages per a art, tecnologia i innovació”. Artnodes, no. 26, pp. 1-9, doi:10.7238/a.v0i26.3362.

Drets

Aquesta obra està sota una llicència internacional Creative Commons Reconeixement 4.0.

(c) Sharath Chandra Ramakrishnan, 2020

Drets d'autor

Els continguts publicats a Artnodes estan subjectes a una llicència de Reconeixement 4.0 Internacional de Creative Commons, el text complet de la qual es pot consultar a http://creativecommons.org/licenses/by/4.0/; els autors retenen el copyright. Podeu copiar-los, distribuir-los, comunicar-los públicament i fer-ne obres derivades sempre que reconegueu els crèdits de les obres (autoria, nom de la revista, institució editora) de la manera especificada pels autors o per la revista.

És responsabilitat dels autors obtenir els permisos necessaris de les imatges que estiguin subjectes a copyright.

Cessió de drets de propietat intel·lectual

L’autor cedeix en règim no exclusiu als editors de la revista els drets d’explotació (reproducció, distribució, comunicació pública i transformació) per a explotar i comercialitzar l’obra, sencera o en part, en tots els formats i modalitats d’explotació presents o futurs, en tots els idiomes, per tot el període de vida de l’obra i per tot el món.

Declaro que sóc l’autor original de l’obra. Els editors queden, per tant, exonerats de qualsevol obligació o responsabilitat per qualsevol acció legal que es pugui suscitar derivada de l’obra dipositada per la vulneració de drets de tercers, siguin de propietat intel·lectual o industrial, de secret comercial o qualsevol altre.

Biografia de l'autor/a

Sharath Chandra Ramakrishnan, Escola d’Arts, Tecnologia i Comunicació Emergent Universitat de Texas, Dallas

Sharath Chandra Ramakrishnan és un investigador híbrid en tecnologia creativa i educador en els camps de les ciències cognitives, la interacció màquina-humà i la política tecnològica. És Director del Laboratori cultural de senyals que estudia les possibilitats creatives i les implicacions tecnoculturals de les tecnologies de IA generalitzades en sistemes d'escolta humà-màquina. Com a investigador de neurociència cognitiva, ha estudiat les xarxes de cognició multimodal i auditiva en el processament del so i del llenguatge a l'Institut nacional de salut mental i neurociència de Bangalore, Índia. Com radioaficionat amb llicència (codi: VU3HPA), estén la seva pràctica amb so i senyals en l'espectre sense fil com a artista de transmissió i senyals. Els seus estudis de doctorat en Art i Tecnologia busquen fer contribucions noves al camp dels Estudis del so, cognició auditiva i sistemes d’escolta, i abans d’això es va especialitzar en IA i entorns virtuals interactius a la Facultat d’Informàtica de la Universitat d’Edimburg. Twitter: @AgentSpock

Referències

Bauman, H-Dirksen L., and Joseph J. Murray. Deaf gain: Raising the Stakes for Human Diversity. University of Minnesota Press, 2014.

Bell, Alexander Graham, Lieut-Col Frank Bolton, and William Edward Lang- don. The Telephone: A Lecture Entitled Researches in Electric Telephony (Illustrated Edition). Echo Library, 2017.

Bentham, Jeremy. “The Panopticon.” In Offenders or Citizens?, edited by Philip Priestley and Maurice Vanstone, 28–30. London: Willan, 2012.

Bregman, Albert S. Auditory Scene Analysis. The MIT Press, 2001. https://doi.org/10.1016/B0-08-043076-7/00663-X

Brown, Guy J., and Martin Cooke. “Computational Auditory Scene Analysis.” Computer Speech and Language 8, no. 4 (1994): 297–336. https://doi.org/10.1006/csla.1994.1016

Cherry, Colin. “Cocktail Party Problem.” Journal of the Acoustical Society of America 25 (1953): 975–979.

Cox, Christopher. “The Alien’s Voice: Alvin Lucier’s North American Time Capsule.” In Mainframe Experimentalism: Early Computing and the Foundations of the Digital Arts. Berkeley: University of California Press, 2009.

Crawford, Kate, and Ryan Calo. 2016. “There is a blind spot in AI research.”
Nature 538, no. 7625 (2016): 311–313.

Deleuze, Gilles. Foucault. University of Minnesota Press, 1988.

Denbigh, Philip N., and J. Zhao. “Pitch extraction and separation of overlapping speech.” Speech Communication 11, nos. 2-3 (1992): 119–125.

Dudley, Homer, and Thomas H. Tarnoczy. “The Speaking Machine of Wolfgang von Kempelen.” The Journal of the Acoustical Society of America 22, no. 2 (1950): 151–166.
Ganchrow, Raviv. “Perspectives on Sound-Space: The Story of Acoustic Defense.” Leonardo Music Journal (2009): 71-75.https://doi.org/10.1121/1.1906583

Kittler, Friedrich. “Thinking colours and/or machines.” Theory, Culture & Society 23, nos 7-8 (2006): 39–50. https://doi.org/10.1177/0263276406069881

Latour, Bruno. We Have Never Been Modern. Harvard University Press, 2012.

Layton, Edward. “Conditions of technological development.” Science,
Technology, and Society (1977).

Luo, Yi, and Nima Mesgarani. 2018. “TasNet: time-domain audio separa- tion network for real-time, single-channel speech separation.” In 2018 IEEE International Conference on Acoustics, Speech and Signal Pro- cessing (ICASSP), 696–700. IEEE.

Mara, Mills. “Deaf Jam: From Inscription to Reproduction to Informa- tion.” Social Text 28 (2010): 35-58. https://doi.org/10.1215/01642472-2009-059

Mayr, Otto. “The science-technology relationship as a historiographic problem.” Technology and Culture 17, no. 4 (1976): 663–673.

Mellinger, David K. “Event Formation and Separation in Musical Sound.” PhD diss., Department of Computer Science, Stanford University, 1991.
Parsons, Thomas W. “Separation of speech from interfering speech by means of harmonic selection.” The Journal of the Acoustical Society of America 60, no. 4 (1976): 911–918.

Peters, John Durham. “Helmholtz, Edison, and Sound History.” In Memory Bytes: History, Technology, and Digital Culture, 177–198. Duke University Press, 2004.
Pickett, J. M. “Historical notes and preface.” American Annals of the Deaf 113, no.2 (March 1968): 117–119.

Pinch, Trevor J, and Wiebe E Bijker. “The social construction of facts and artefacts: Or how the sociology of science and the sociology of tech- nology might benefit each other.” Social Studies of Science 14, no. 3 (1984): 399– 441.

Price, Derek J. de Solla, Silvio A. Bedini, et al. “Automata in History.”
Technology and Culture 5, no. 1 (1964): 9–23.

Rice, Albert R. “The Android Clarinettist by Cornelis Jacobus van Oeckelen (1838).” Journal of the American Musical Instrumental Society 40 (2014): 163–189.
Riskin, Jessica. “The defecating duck, or, the ambiguous origins of artificial life.” Critical Inquiry 29, no. 4 (2003): 599–633. https://doi.org/10.1086/377722

Sabine, Wallace Clement, and M. David Egan. “Collected Papers on Acoustics.” The Journal of the Acoustical Society of America 95, no. 3679 (1994). https://doi.org/10.1121/1.409944

Sheets-Johnstone, Maxine. The Corporeal Turn: An Interdisciplinary Reader. Andrews UK Limited, 2015.

Sterne, Jonathan. The Audible Past: Cultural Origins of Sound Repro- duction. Duke University Press, 2003. https://doi.org/10.1215/9780822384250

Stubbs, Richard J., and Quentin Summerfield. “Algorithms for separat-ing the speech of interfering talkers: Evaluations with voiced sentences, and normal-hearing and hearing-impaired listeners.” The Journal of the Acoustical Society of America 87, no. 1 (1990): 359–372.

Taori, Rohan, Amog Kamsetty, Brenton Chu, and Nikita Vemuri. 2019. “Tar- geted Adversarial Examples for Black Box Audio Systems.” In 2019 IEEE Security and Privacy Workshops (SPW), 15–20. IEEE.

Tlalim, Tom. “Tonotopia: Co-designing sound art with hearing implant users: Podcast.” 2017.

Triandis, Harry C. The Analysis of Subjective Culture. New York: Wiley-Interscience, 1972.

Voskuhl, Adelheid. “Humans, machines, and conversations: An ethno- graphic study of the making of automatic speech recognition technolo- gies.” Social Studies of Science 34, no. 3 (2004): 393–421. https://doi.org/10.1177/0306312704043576

Weintraub, Mitchel. 1986. “A computational model for separating two si- multaneous talkers.” In ICASSP’86. IEEE International Conference on Acoustics, Speech, and Signal Processing 11:81–84. IEEE.

Wise, John Macgregor. Exploring Technology and Social Space Vol. 1.
Sage, 1997.

Zhang, Guoming, Chen Yan, Xiaoyu Ji, Tianchen Zhang, Taimin Zhang, and Wenyuan Xu. 2017. “DolphinAttack: Inaudible Voice Commands.” In Proceedings of the 2017 ACM SIGSAC Conference on Computer and Communications Security, 103–117. https://doi.org/10.1145/3133956.3134052

Article Sidebar

Main Article Content

Article Details

Drets d'autor

Cessió de drets de propietat intel·lectual

Sharath Chandra Ramakrishnan, Escola d’Arts, Tecnologia i Comunicació Emergent Universitat de Texas, Dallas

Articles similars