Derechos de autor y entrenamiento de sistemas de IA generativos: las obligaciones de transparencia y la minería de textos y datos en la normativa europea

Main Article Content

Jorge Luis Ordelin Font

La relación de los derechos de autor y la IA, en particular la generativa, supone innumerables retos y contradicciones. En el centro de todos los debates, se encuentran los derechos de los titulares de las obras y demás prestaciones artísticas. Las obras y prestaciones son utilizadas para entrenar modelos de IA, como fuente de datos, lo cual supone una pérdida económica para los titulares. El Reglamento de IA de la Unión Europea ofrece algunas herramientas para poder contrarrestar esta situación, sin embargo, su alcance es limitado. El presente artículo tiene como objetivo analizar los retos y limitaciones de estas herramientas, en particular la transparencia algorítmica y la limitación de la minería de textos y datos.

Palabras clave
derechos de autor, entrenamiento de datos, IA generativa, minería de textos y datos, transparencia algorítmica

Article Details

Cómo citar
Ordelin Font, Jorge Luis. «Derechos de autor y entrenamiento de sistemas de IA generativos: las obligaciones de transparencia y la minería de textos y datos en la normativa europea». IDP. Revista de Internet, Derecho y Política, 2025, n.º 42, pp. 1-13, doi:10.7238/idp.v0i42.431327.
Biografía del autor/a

Jorge Luis Ordelin Font, Centro de Investigación y Docencia Económicas (CIDE), México

Profesor investigador titular de Propiedad Intelectual y Nuevas Tecnologías de la División de Estudios Jurídicos del Centro de Investigación y Docencia Económicas (CIDE), México. Investigador nacional nivel I del Sistema Nacional de Investigadores, México. Profesor de la maestría en Derecho y TIC del Centro de Investigación e Innovación en TIC (INFOTEC), México. Conferencista invitado de la Organización Mundial de la Propiedad Intelectual (OMPI) en los ámbitos del derecho de autor y nuevas tecnologías. Miembro de la Línea de Investigación de Derecho e Inteligencia Artificial del Instituto de Investigaciones Jurídicas de la UNAM y experto de la cátedra Iberoamericana de Cultura Digital y Propiedad Intelectual, promovida por la Organización de Estados Iberoamericanos para la Educación, la Ciencia y la Cultura, en colaboración con la Universidad de Alicante. Consultor en temas de propiedad intelectual, inteligencia artificial y nuevas tecnologías.

Citas

COLE, S. (2024). «AI Video Generator Runway Trained on Thousands of YouTube Videos Without Permission». 404media [en línea]. Disponible en: https://www.404media.co/runway-ai-image-generator-training-data-youtube/. [Fecha de consulta: 14 de agosto de 2024].

CRAWFORD, K., SCHULTZ, J. «Generative AI Is a Crisis for Copyright Law». Issues in science and technology. DOI: https://doi.org/10.58875/GUYG6120. [Fecha de consulta: 9 de agosto de 2024].

Directiva 96/9/CE del Parlamento Europeo y del Consejo, de 11 de marzo de 1996, sobre la protección jurídica de las bases de datos. Diario Oficial de las Comunidades Europeas. L 77/20. 27. 3. 96 [en línea]. Disponible en: https://eur-lex.europa.eu/legal-content/ES/TXT/PDF/?uri=CELEX:31996L0009. [Fecha de consulta: 9 de agosto de 2024].

Directiva 2001/29/CE del Parlamento Europeo y del Consejo, de 22 de mayo de 2001, relativa a la armonización de determinados aspectos de los derechos de autor y derechos afines a los derechos de autor en la sociedad de la información. Diario Oficial de las Comunidades Europeas. L 167/10. 22.6.2001 [en línea]. Disponible en: https://eur-lex.europa.eu/legal-content/ES/TXT/PDF/?uri=CELEX:32001L0029. [Fecha de consulta: 9 de agosto de 2024].

Directiva 2009/24/CE del Parlamento Europeo y del Consejo, de 23 de abril de 2009 , sobre la protección jurídica de programas de ordenador. Diario Oficial de las Comunidades Europeas. L 111/16. 5.5.2009. [en línea]. Disponible en: https://eur-lex.europa.eu/legal-content/ES/TXT/PDF/?uri=CELEX:32009L0024. [Fecha de consulta: 9 de agosto de 2024].

Directiva (UE) 2019/790 del Parlamento Europeo y del Consejo, de 17 de abril de 2019, sobre los derechos de autor y derechos afines en el mercado único digital. Diario Oficial de la Unión Europea. L 130/92, 17.05.2019. [en línea]. Disponible en: https://eur-lex.europa.eu/legal-content/ES/TXT/PDF/?uri=CELEX:32019L0790. [Fecha de consulta: 2 de agosto de 2024].

DORNIS, T. W.; STOBER, S. (2024). Urheberrecht und Training generativer KI-Modelle. Baden-Baden: Nomos. DOI: https://doi.org/10.5771/9783748949558-1. [Fecha de consulta: 22 de diciembre de 2024].

EUROPEAN INNOVATION COUNCIL y la SMES EXECUTIVE AGENCY (2024). «Artificial intelligence and copyright: use of generative AI tools to develop new content» [blog en línea]. Disponible en: https://intellectual-property-helpdesk.ec.europa.eu/news-events/news/artificial-intelligence-and-copyright-use-generative-ai-tools-develop-new-content-2024-07-16-0_en. [Fecha de consulta: 20 de julio de 2024].

EU AI Office (2024). «Second Draft of the General-Purpose AI Code of Practice» [en línea]. Disponible en: https://digital-strategy.ec.europa.eu/en/library/second-draft-general-purpose-ai-code-practice-published-written-independent-experts. [Fecha de consulta: 22 de diciembre de 2024].

GARCÍA VIDAL, Á. (2024). «Propiedad intelectual, minería de textos y datos y entrenamiento de la inteligencia artificial». GA_P [en línea]. Dispnible en: https://ga-p.com/wp-content/uploads/2024/10/Mineria_textos_datos.pdf. [Fecha de consulta: 22 de diciembre de 2024].

GONZÁLEZ OTERO, B. (2019). «Las excepciones de minería de textos y datos más allá de los derechos de autor: la ordenación privada contraataca». En: SÁIZ GARCÍA, C. y EVANGELIO LLORCA, R. Propiedad Intelectual y Mercado Único Digital Europeo. València: Tirant-Lo Blanch. DOI: https://doi.org/10.2139/ssrn.3477197

GUADAMUZ, A. (2023). «Photographer sues LAION for copyright infringement». TechnoLlama [en línea]. Disponible en: https://www.technollama.co.uk/photographer-sues-laion-for-copyright-infringement. [Fecha de consulta: 9 de agosto de 2024].

HAVE I BEEN TRAINED (s. f.). «Frequently Asked Questions». Have I Been Trained? [en línea]. Disponible en: https://haveibeentrained.com/faq. [Fecha de consulta: 9 de agosto de 2024].

OPENAI (s. f.). «Europe Terms of Use». OpenAI [en línea]. Disponible en: https://openai.com/policies/terms-of-use/. [Fecha de consulta: 15 de agosto de 2024].

HUTIRI, W.; PAPAKYRIAKOPOULOS, O.; XIANG, A. (2024). «Not My Voice! A Taxonomy of Ethical and Safety Harms of Speech Generators». En: Proceedings of the 2024 ACM Conference on Fairness, Accountability, and Transparency (FAccT ‘24). New York: Association for Computing Machinery, págs. 359-376. DOI: https://doi.org/10.1145/3630106.3658911. [Fecha de consulta: 2 de agosto de 2024].

IN RE OPENAI CHATGPT LITIGATION (2024). Training Data Inspection Protocol. United States District Court. Northern District of California San Francisco Division. Master File Case No. 3:23-CV-03223, [en línea]. Disponible en: https://app.ediscoveryassistant.com/case_law/59943-in-re-openai-chatgpt-litig. [Fecha de consulta: 2 de diciembre de 2024].

INTELLECTUAL PROPERTY OFFICE, DEPARTMENT FOR SCIENCE, INNOVATION & TECHNOLOGY AND DEPARTMENT FOR CULTURE, MEDIA & SPORT (2024). «Open consultation. Copyright and Artificial Intelligence». Gov.uk [en línea]. Disponible en: https://www.gov.uk/government/consultations/copyright-and-artificial-intelligence/copyright-and-artificial-intelligence. [Fecha de consulta: 22 de diciembre de 2024].

JIMÉNEZ SERRANÍA, V. (2024). «Medidas de apoyo a la innovación y arquitectura de gobernanza». En: JIMÉNEZ SERRANÍA, V., CASTILLA BAREA, M., MÍGUEZ MACHO, L, BARRIO ANDRÉS, M., DELGADO MARTÍN, J., MUÑOZ GARCÍA, C., & TORRES CARLOS, M. (2024). El Reglamento Europeo de Inteligencia Artificial. València: Tirant lo Blanch, págs. 111-138 [en línea]. Disponible en: https://biblioteca-nubedelectura-com.eu1.proxy.openathens.net/cloudLibrary/ebook/info/9788410713048. [Fecha de consulta: 20 de julio de 2024].

JONES, E. (2023). «What is a foundation model?». Ada Lovelace Institute [en línea]. Disponible en: https://www.adalovelaceinstitute.org/resource/foundation-models-explainer/. [Fecha de consulta: 20 de junio de 2024].

KNESCHKE, R. (2024). «Was ist erlaubt beim Erstellen von KI-Trainingsdaten? Erster Verhandlungstag im Verfahren gegen LAION e.V.» Traducción realizada con la versión gratuita del traductor DeepL.com. Alltag eines Fotoproduzenten [en línea]. Disponible en: https://www.alltageinesfotoproduzenten.de/2024/07/12/was-ist-erlaubt-beim-erstellen-von-ki-trainingsdaten-erster-verhandlungstag-im-verfahren-gegen-laion-e-v/. [Fecha de consulta: 15 de agosto de 2024].

MEZEI, P. (2024). «A Saviour or a dead end? Reservation of rights in the age of generative AI». European Intellectual Property Review, vol. 46, n.º 7, págs. 461-469. DOI: https://doi.org/10.2139/ssrn.4695119. [Fecha de consulta: 9 de agosto de 2024].

MUMSNET, J. (2024). «Why we’re taking legal action against Open AI and other scrapers». Mumsnet [en línea]. Disponible en: https://www.mumsnet.com/talk/site_stuff/5122770-why-were-taking-legal-action-against-open-ai-and-other-scrapers. [Fecha de consulta: 15 de agosto de 2024].

OPENAI (2023). «Written evidence (LLM0113) House of Lords Communications and Digital Select Committee inquiry: Large language models». Parliament.uk [en línea]. Disponible en: https://committees.parliament.uk/writtenevidence/126981/pdf/. [Fecha de consulta: 20 de febrero de 2024].

OPENAI (2024). «GPT-4o System Card». OpenAI [en línea]. Disponible en: https://cdn.openai.com/gpt-4o-system-card.pdf. [Fecha de consulta: 9 de agosto de 2024].

OCDE (2024). «Recommendation of the Council on Artificial Intelligence». OECD/LEGAL/0463 [en línea]. Disponible en: https://legalinstruments.oecd.org/en/instruments/oecd-legal-0449. [Fecha de consulta: 9 de agosto de 2024].

Resolución del Parlamento Europeo, de 20 de octubre de 2020, sobre los derechos de propiedad intelectual para el desarrollo de las tecnologías relativas a la inteligencia artificial (2020/2015(INI) [en línea]. Disponible en: https://www.europarl.europa.eu/doceo/document/TA-9-2020-0277_ES.html. [Fecha de consulta: 2 de agosto de 2024].

Reglamento (UE) 2024/1689 del Parlamento Europeo y del Consejo de 13 de junio de 2024 por el que se establecen normas armonizadas en materia de inteligencia artificial. Diario Oficial de la Unión Europea, 12.07.2024 [en línea]. Disponible en: https://eur-lex.europa.eu/legal-content/ES/TXT/PDF/?uri=OJ:L_202401689. [Fecha de consulta: 2 de agosto de 2024].

SAG, M. (2019). «The New Legal Landscape for Text Mining and Machine Learning». Journal of the Copyright Society of the USA, vol. 66, pág. 291 [en línea]. Disponible en: https://ssrn.com/abstract=3331606. [Fecha de consulta: 23 de noviembre de 2023].

SHEN, M. (2024). «Rethinking Data Selection for Supervised Fine-Tuning». arXiv [en línea]. Disponible en: https://arxiv.org/pdf/2402.06094. [Fecha de consulta: 14 de agosto de 2024].

SHIKSHA ONLINE (2023). «Text Mining in Data Mining». Shiksha online [en línea]. Disponible en: https://www.shiksha.com/online-courses/articles/text-mining-in-data-mining/. [Fecha de consulta: 23 de julio de 2023].

Sentencia 310 o 227/23. Tribunal Regional de Hamburgo, Sala de lo Civil 10, 27 de septiembre de 2024.

UNESCO (2021). Recomendación sobre la Ética de la Inteligencia Artificial, Paris [en línea]. Disponible en: https://www.unesco.org/es/legal-affairs/recommendation-ethics-artificial-intelligence. [Fecha de consulta: 2 de agosto de 2024].

UMG Recordings, Inc. v. Uncharted Labs, Inc. (1:24-cv-04777), District Court, S.D. New York (2024), [en línea]. Disponible en: https://storage.courtlistener.com/recap/gov.uscourts.nysd.623701/gov.uscourts.nysd.623701.26.0.pdf. [Fecha de consulta: 14 de agosto de 2024].

Cita recomendada

ORDELIN FONT, jorge Luis (2025). «Derechos de autor y entrenamiento de sistemas de IA generativos: las obligaciones de transparencia y la minería de textos y datos en la normativa europea». IDP. Revista de Internet, Derecho y Política, núm. 42. UOC. [Fecha de consulta: dd/mm/aa]. DOI: http://dx.doi.org/10.7238/idp.v0i42.431327

Los textos publicados en esta revista están —si no se indica lo contrario— bajo una licencia Reconocimiento-Sin obras derivadas 3.0 España de Creative Commons. Puede copiarlos, distribuirlos y comunicarlos públicamente siempre que cite su autor y la revista y la institución que los publica (IDP. Revista de Internet, Derecho y Política; UOC); no haga con ellos obras derivadas. La licencia completa se puede consultar en: http://creativecommons.org/licenses/by-nd/3.0/es/deed.es.

Artículos similares

1 2 3 4 5 6 7 8 9 10 > >> 

También puede {advancedSearchLink} para este artículo.