Derechos de autor y entrenamiento de sistemas de IA generativos: las obligaciones de transparencia y la minería de textos y datos en la normativa europea
Article Sidebar
Main Article Content
La relación de los derechos de autor y la IA, en particular la generativa, supone innumerables retos y contradicciones. En el centro de todos los debates, se encuentran los derechos de los titulares de las obras y demás prestaciones artísticas. Las obras y prestaciones son utilizadas para entrenar modelos de IA, como fuente de datos, lo cual supone una pérdida económica para los titulares. El Reglamento de IA de la Unión Europea ofrece algunas herramientas para poder contrarrestar esta situación, sin embargo, su alcance es limitado. El presente artículo tiene como objetivo analizar los retos y limitaciones de estas herramientas, en particular la transparencia algorítmica y la limitación de la minería de textos y datos.
Article Details

Esta obra está bajo una licencia Creative Commons Reconocimiento-SinObraDerivada 3.0 Unported.
(c) Jorge Luis Ordelin Font, 2025
Derechos de autor
Los contenidos publicados en IDP están bajo una licencia de Reconocimiento-Sin obras derivadas 3.0 España de Creative Commons, cuyo texto completo se puede consultar en http://creativecommons.org/licenses/by-nc-nd/3.0/es/deed.es. Así pues, se permite la copia, distribución y comunicación pública siempre y cuando se cite el autor del texto, la revista (IDP. Revista de Internet, Derecho y Política y la institución que los publica (UOC), tal como consta en la citación recomendada que aparece en cada artículo. No se pueden hacer obras derivadas.
Es responsabilidad de los autores obtener los permisos necesarios de las imágenes que estén sujetas a copyright.
Cesión de derechos de propiedad intelectual
El autor cede sin exclusiva a los editores de la revista los derechos de explotación (reproducción, distribución, comunicación pública y transformación) para explotar y comercializar la obra, entera o en parte, en todos los formatos y modalidades de explotación presentes o futuros, en todos los idiomas, por todo el periodo de vida de la obra y por todo el mundo.
El autor debe declarar que es el autor original de la obra. Los editores quedan, por lo tanto, exonerados de cualquier obligación o responsabilidad por cualquier acción legal que pueda suscitarse derivada de la obra depositada por la vulneración de derechos de terceros, sean de propiedad intelectual o industrial, de secreto comercial o cualquier otro.
Jorge Luis Ordelin Font, Centro de Investigación y Docencia Económicas (CIDE), México
Profesor investigador titular de Propiedad Intelectual y Nuevas Tecnologías de la División de Estudios Jurídicos del Centro de Investigación y Docencia Económicas (CIDE), México. Investigador nacional nivel I del Sistema Nacional de Investigadores, México. Profesor de la maestría en Derecho y TIC del Centro de Investigación e Innovación en TIC (INFOTEC), México. Conferencista invitado de la Organización Mundial de la Propiedad Intelectual (OMPI) en los ámbitos del derecho de autor y nuevas tecnologías. Miembro de la Línea de Investigación de Derecho e Inteligencia Artificial del Instituto de Investigaciones Jurídicas de la UNAM y experto de la cátedra Iberoamericana de Cultura Digital y Propiedad Intelectual, promovida por la Organización de Estados Iberoamericanos para la Educación, la Ciencia y la Cultura, en colaboración con la Universidad de Alicante. Consultor en temas de propiedad intelectual, inteligencia artificial y nuevas tecnologías.
COLE, S. (2024). «AI Video Generator Runway Trained on Thousands of YouTube Videos Without Permission». 404media [en línea]. Disponible en: https://www.404media.co/runway-ai-image-generator-training-data-youtube/. [Fecha de consulta: 14 de agosto de 2024].
CRAWFORD, K., SCHULTZ, J. «Generative AI Is a Crisis for Copyright Law». Issues in science and technology. DOI: https://doi.org/10.58875/GUYG6120. [Fecha de consulta: 9 de agosto de 2024].
Directiva 96/9/CE del Parlamento Europeo y del Consejo, de 11 de marzo de 1996, sobre la protección jurídica de las bases de datos. Diario Oficial de las Comunidades Europeas. L 77/20. 27. 3. 96 [en línea]. Disponible en: https://eur-lex.europa.eu/legal-content/ES/TXT/PDF/?uri=CELEX:31996L0009. [Fecha de consulta: 9 de agosto de 2024].
Directiva 2001/29/CE del Parlamento Europeo y del Consejo, de 22 de mayo de 2001, relativa a la armonización de determinados aspectos de los derechos de autor y derechos afines a los derechos de autor en la sociedad de la información. Diario Oficial de las Comunidades Europeas. L 167/10. 22.6.2001 [en línea]. Disponible en: https://eur-lex.europa.eu/legal-content/ES/TXT/PDF/?uri=CELEX:32001L0029. [Fecha de consulta: 9 de agosto de 2024].
Directiva 2009/24/CE del Parlamento Europeo y del Consejo, de 23 de abril de 2009 , sobre la protección jurídica de programas de ordenador. Diario Oficial de las Comunidades Europeas. L 111/16. 5.5.2009. [en línea]. Disponible en: https://eur-lex.europa.eu/legal-content/ES/TXT/PDF/?uri=CELEX:32009L0024. [Fecha de consulta: 9 de agosto de 2024].
Directiva (UE) 2019/790 del Parlamento Europeo y del Consejo, de 17 de abril de 2019, sobre los derechos de autor y derechos afines en el mercado único digital. Diario Oficial de la Unión Europea. L 130/92, 17.05.2019. [en línea]. Disponible en: https://eur-lex.europa.eu/legal-content/ES/TXT/PDF/?uri=CELEX:32019L0790. [Fecha de consulta: 2 de agosto de 2024].
DORNIS, T. W.; STOBER, S. (2024). Urheberrecht und Training generativer KI-Modelle. Baden-Baden: Nomos. DOI: https://doi.org/10.5771/9783748949558-1. [Fecha de consulta: 22 de diciembre de 2024].
EUROPEAN INNOVATION COUNCIL y la SMES EXECUTIVE AGENCY (2024). «Artificial intelligence and copyright: use of generative AI tools to develop new content» [blog en línea]. Disponible en: https://intellectual-property-helpdesk.ec.europa.eu/news-events/news/artificial-intelligence-and-copyright-use-generative-ai-tools-develop-new-content-2024-07-16-0_en. [Fecha de consulta: 20 de julio de 2024].
EU AI Office (2024). «Second Draft of the General-Purpose AI Code of Practice» [en línea]. Disponible en: https://digital-strategy.ec.europa.eu/en/library/second-draft-general-purpose-ai-code-practice-published-written-independent-experts. [Fecha de consulta: 22 de diciembre de 2024].
GARCÍA VIDAL, Á. (2024). «Propiedad intelectual, minería de textos y datos y entrenamiento de la inteligencia artificial». GA_P [en línea]. Dispnible en: https://ga-p.com/wp-content/uploads/2024/10/Mineria_textos_datos.pdf. [Fecha de consulta: 22 de diciembre de 2024].
GONZÁLEZ OTERO, B. (2019). «Las excepciones de minería de textos y datos más allá de los derechos de autor: la ordenación privada contraataca». En: SÁIZ GARCÍA, C. y EVANGELIO LLORCA, R. Propiedad Intelectual y Mercado Único Digital Europeo. València: Tirant-Lo Blanch. DOI: https://doi.org/10.2139/ssrn.3477197
GUADAMUZ, A. (2023). «Photographer sues LAION for copyright infringement». TechnoLlama [en línea]. Disponible en: https://www.technollama.co.uk/photographer-sues-laion-for-copyright-infringement. [Fecha de consulta: 9 de agosto de 2024].
HAVE I BEEN TRAINED (s. f.). «Frequently Asked Questions». Have I Been Trained? [en línea]. Disponible en: https://haveibeentrained.com/faq. [Fecha de consulta: 9 de agosto de 2024].
OPENAI (s. f.). «Europe Terms of Use». OpenAI [en línea]. Disponible en: https://openai.com/policies/terms-of-use/. [Fecha de consulta: 15 de agosto de 2024].
HUTIRI, W.; PAPAKYRIAKOPOULOS, O.; XIANG, A. (2024). «Not My Voice! A Taxonomy of Ethical and Safety Harms of Speech Generators». En: Proceedings of the 2024 ACM Conference on Fairness, Accountability, and Transparency (FAccT ‘24). New York: Association for Computing Machinery, págs. 359-376. DOI: https://doi.org/10.1145/3630106.3658911. [Fecha de consulta: 2 de agosto de 2024].
IN RE OPENAI CHATGPT LITIGATION (2024). Training Data Inspection Protocol. United States District Court. Northern District of California San Francisco Division. Master File Case No. 3:23-CV-03223, [en línea]. Disponible en: https://app.ediscoveryassistant.com/case_law/59943-in-re-openai-chatgpt-litig. [Fecha de consulta: 2 de diciembre de 2024].
INTELLECTUAL PROPERTY OFFICE, DEPARTMENT FOR SCIENCE, INNOVATION & TECHNOLOGY AND DEPARTMENT FOR CULTURE, MEDIA & SPORT (2024). «Open consultation. Copyright and Artificial Intelligence». Gov.uk [en línea]. Disponible en: https://www.gov.uk/government/consultations/copyright-and-artificial-intelligence/copyright-and-artificial-intelligence. [Fecha de consulta: 22 de diciembre de 2024].
JIMÉNEZ SERRANÍA, V. (2024). «Medidas de apoyo a la innovación y arquitectura de gobernanza». En: JIMÉNEZ SERRANÍA, V., CASTILLA BAREA, M., MÍGUEZ MACHO, L, BARRIO ANDRÉS, M., DELGADO MARTÍN, J., MUÑOZ GARCÍA, C., & TORRES CARLOS, M. (2024). El Reglamento Europeo de Inteligencia Artificial. València: Tirant lo Blanch, págs. 111-138 [en línea]. Disponible en: https://biblioteca-nubedelectura-com.eu1.proxy.openathens.net/cloudLibrary/ebook/info/9788410713048. [Fecha de consulta: 20 de julio de 2024].
JONES, E. (2023). «What is a foundation model?». Ada Lovelace Institute [en línea]. Disponible en: https://www.adalovelaceinstitute.org/resource/foundation-models-explainer/. [Fecha de consulta: 20 de junio de 2024].
KNESCHKE, R. (2024). «Was ist erlaubt beim Erstellen von KI-Trainingsdaten? Erster Verhandlungstag im Verfahren gegen LAION e.V.» Traducción realizada con la versión gratuita del traductor DeepL.com. Alltag eines Fotoproduzenten [en línea]. Disponible en: https://www.alltageinesfotoproduzenten.de/2024/07/12/was-ist-erlaubt-beim-erstellen-von-ki-trainingsdaten-erster-verhandlungstag-im-verfahren-gegen-laion-e-v/. [Fecha de consulta: 15 de agosto de 2024].
MEZEI, P. (2024). «A Saviour or a dead end? Reservation of rights in the age of generative AI». European Intellectual Property Review, vol. 46, n.º 7, págs. 461-469. DOI: https://doi.org/10.2139/ssrn.4695119. [Fecha de consulta: 9 de agosto de 2024].
MUMSNET, J. (2024). «Why we’re taking legal action against Open AI and other scrapers». Mumsnet [en línea]. Disponible en: https://www.mumsnet.com/talk/site_stuff/5122770-why-were-taking-legal-action-against-open-ai-and-other-scrapers. [Fecha de consulta: 15 de agosto de 2024].
OPENAI (2023). «Written evidence (LLM0113) House of Lords Communications and Digital Select Committee inquiry: Large language models». Parliament.uk [en línea]. Disponible en: https://committees.parliament.uk/writtenevidence/126981/pdf/. [Fecha de consulta: 20 de febrero de 2024].
OPENAI (2024). «GPT-4o System Card». OpenAI [en línea]. Disponible en: https://cdn.openai.com/gpt-4o-system-card.pdf. [Fecha de consulta: 9 de agosto de 2024].
OCDE (2024). «Recommendation of the Council on Artificial Intelligence». OECD/LEGAL/0463 [en línea]. Disponible en: https://legalinstruments.oecd.org/en/instruments/oecd-legal-0449. [Fecha de consulta: 9 de agosto de 2024].
Resolución del Parlamento Europeo, de 20 de octubre de 2020, sobre los derechos de propiedad intelectual para el desarrollo de las tecnologías relativas a la inteligencia artificial (2020/2015(INI) [en línea]. Disponible en: https://www.europarl.europa.eu/doceo/document/TA-9-2020-0277_ES.html. [Fecha de consulta: 2 de agosto de 2024].
Reglamento (UE) 2024/1689 del Parlamento Europeo y del Consejo de 13 de junio de 2024 por el que se establecen normas armonizadas en materia de inteligencia artificial. Diario Oficial de la Unión Europea, 12.07.2024 [en línea]. Disponible en: https://eur-lex.europa.eu/legal-content/ES/TXT/PDF/?uri=OJ:L_202401689. [Fecha de consulta: 2 de agosto de 2024].
SAG, M. (2019). «The New Legal Landscape for Text Mining and Machine Learning». Journal of the Copyright Society of the USA, vol. 66, pág. 291 [en línea]. Disponible en: https://ssrn.com/abstract=3331606. [Fecha de consulta: 23 de noviembre de 2023].
SHEN, M. (2024). «Rethinking Data Selection for Supervised Fine-Tuning». arXiv [en línea]. Disponible en: https://arxiv.org/pdf/2402.06094. [Fecha de consulta: 14 de agosto de 2024].
SHIKSHA ONLINE (2023). «Text Mining in Data Mining». Shiksha online [en línea]. Disponible en: https://www.shiksha.com/online-courses/articles/text-mining-in-data-mining/. [Fecha de consulta: 23 de julio de 2023].
Sentencia 310 o 227/23. Tribunal Regional de Hamburgo, Sala de lo Civil 10, 27 de septiembre de 2024.
UNESCO (2021). Recomendación sobre la Ética de la Inteligencia Artificial, Paris [en línea]. Disponible en: https://www.unesco.org/es/legal-affairs/recommendation-ethics-artificial-intelligence. [Fecha de consulta: 2 de agosto de 2024].
UMG Recordings, Inc. v. Uncharted Labs, Inc. (1:24-cv-04777), District Court, S.D. New York (2024), [en línea]. Disponible en: https://storage.courtlistener.com/recap/gov.uscourts.nysd.623701/gov.uscourts.nysd.623701.26.0.pdf. [Fecha de consulta: 14 de agosto de 2024].
Cita recomendada
ORDELIN FONT, jorge Luis (2025). «Derechos de autor y entrenamiento de sistemas de IA generativos: las obligaciones de transparencia y la minería de textos y datos en la normativa europea». IDP. Revista de Internet, Derecho y Política, núm. 42. UOC. [Fecha de consulta: dd/mm/aa]. DOI: http://dx.doi.org/10.7238/idp.v0i42.431327
Los textos publicados en esta revista están —si no se indica lo contrario— bajo una licencia Reconocimiento-Sin obras derivadas 3.0 España de Creative Commons. Puede copiarlos, distribuirlos y comunicarlos públicamente siempre que cite su autor y la revista y la institución que los publica (IDP. Revista de Internet, Derecho y Política; UOC); no haga con ellos obras derivadas. La licencia completa se puede consultar en: http://creativecommons.org/licenses/by-nd/3.0/es/deed.es.
Artículos similares
- Lorenzo Cotino Hueso, La obligación de relacionarse electrónicamente con la Administración y sus escasas garantías , IDP. Revista de Internet, Derecho y Política: Núm. 26 (2018)
- Jesús García-García, Ricardo Curto-Rodríguez, El ejercicio de la rendición de cuentas mediante portales de datos abiertos en las comunidades autónomas españolas , IDP. Revista de Internet, Derecho y Política: Núm. 29 (2019)
- Cristina Blasi Casagran, Lidia Ballesta Marti, Santiago Robert Guillén, Eduard Blasi Casagran, Navegar por el panorama legal de la IA. Implicaciones de género en los modelos extensos de lenguaje en la generación de texto legal , IDP. Revista de Internet, Derecho y Política: Núm. 44: Monográfico sobre la consolidación del trabajo a distancia (marzo 2026)
- David Comet-Herrera, Lucía Benítez-Eyzaguirre, Las plataformas virtuales de contratación pública del Estado español y su transparencia sobre la consideración de criterios de contratación estratégica , IDP. Revista de Internet, Derecho y Política: Núm. 40 (2024): Marzo
- Jorge Agustín Viguri Cordero, Las normas ISO/IEC como mecanismos de responsabilidad proactiva en el Reglamento General de Protección de Datos , IDP. Revista de Internet, Derecho y Política: Núm. 33 (2021): octubre
- Miguel Ángel Presno Linera, Policía predictiva y prevención de la violencia de género: el sistema VioGén , IDP. Revista de Internet, Derecho y Política: Núm. 39 (2023): Noviembre. Monográfico: "Digitalización y algoritmización de la justicia"
- Wendy Requejo-Passoni, El dilema de las copias de seguridad en el delito de sabotaje contra datos informáticos en el derecho penal español , IDP. Revista de Internet, Derecho y Política: Núm. 41 (2024): Octubre
- Agustí Cerrillo, El derecho para una inteligencia artificial centrada en el ser humano y al servicio de las instituciones , IDP. Revista de Internet, Derecho y Política: Núm. 30 (2020)
- Agustí Cerrillo i Martínez, Los principios de los datos abiertos en la legislación española , IDP. Revista de Internet, Derecho y Política: Núm. 19 (2014)
- Maiia Otchenash, Demandas a plataformas web por violación de derechos de autor: la decisión del tribunal y jurisdicción en el caso del «Proyecto Gutenberg» , IDP. Revista de Internet, Derecho y Política: Núm. 29 (2019)
También puede {advancedSearchLink} para este artículo.