Las editoriales francesas están hartas y acaban de demandar a Meta por violación del copyright. No son las primeras ni serán las últimas, pero el problema no es ese: el problema es que las empresas de IA han usado contenidos con derechos de autor para entrenar sus modelos, y es como si no pasara nada.
Todo sigue igual. Han pasado más dos años desde que Getty denunciara a Stable Diffusion, a la que acusaba de robar sus fotos para entrenar su modelo de IA de generación de imágenes. Aquella fue la primera de una gran lista de demandas por exactamente lo mismo, pero a pesar del tiempo que ha transcurrido, no ha habido novedades al respecto. Es como si lo que hizo Stable Diffusion —como las demás— acabara en un segundo plano para los tribunales de justicia.
¿Copyqué? La sospecha sobre este tipo de comportamientos ha sido constante, y lo era ya antes de que se lanzase ChatGPT en noviembre de 2022. Meses antes, en junio, DALL-E fue acusada de basarse en imágenes con derechos de autor de creadores que no recibían nada a cambio. Microsoft, OpenAI y GitHub también fueron demandados unas semanas antes del lanzamiento de ChatGPT, pero esta vez porque GitHub Copilot había sido entrenado sin permiso con código de diversos desarrolladores que no habían dado su permiso. Un juez de California desestimó prácticamente todas las reclamaciones de los demandantes en julio de 2024.
Pocas sentencias castigan a las empresas de IA. Por ahora las sentencias que se han producido, como la mencionada, dan la victoria aparente a las empresas de IA. Ocurrió por ejemplo con una demanda contra OpenAI, que la empresa logró ganar. Eso sí, dicha victoria puede salirle cara en su otra gran demanda pendiente con The New York Times, que puede alegar que sufrió un perjuicio demostrable.
¿Uso justo? El juicio del caso de The New York Times contra OpenAI se inició en enero de 2025 y es sin duda uno de los más importantes en este ámbito. La empresa liderada por Sam Altman —que ha usado todos los datos que ha podido— se escuda en que ellos hacen un "uso justo" de los contenidos para poder entrenar sus modelos. Lo curioso es que por un lado dicen eso, y por el otro han ido llegando a acuerdos millonarios con plataformas como Reddit y medios o editoriales como El País precisamente para licenciar sus contenidos y evitar nuevas demandas.
Lo de Meta es otro nivel. Los extremos a los que están llegando las empresas para tener datos de calidad con los que entrenar sus modelos de IA son extraordinarios. Perplexity se saltó las barreras de internet, pero lo de Meta fue aún más llamativo: hace poco supimos que habían utilizado más de 80 TB de libros descargados vía BitTorrent para entrenar su modelo. Muchos de ellos con derechos de autor, algo que ha provocado muchas críticas y la reciente demanda de algunos grupos editoriales franceses.
No parece haber castigo. Pero como decimos, ese robo histórico de propiedad intelectual parece estar ya asumido: no hay sentencias que hayan castigado esas violaciones del copyright de momento, y es como si colectivamente se hubieran ignorado esas violaciones porque la IA ofrece ventajas interesantes. Pero nos estamos olvidando de cómo las han obtenido... o eso parece.
En Xataka | 5.000 "tokens" de mi blog están siendo usados para entrenar una IA. No he dado mi permiso
Ver 11 comentarios
11 comentarios
moreorless
todas se pasan por el cu..... las leyes. pero claro eeuu dice que es china la que copia.
batliebre
Los autores y trabajadores con oficios creativos no nos hemos olvidado en ningún momento de lo que es la mayor infracción de derechos de autor de la historia. Llevamos más de 2 años denunciándolo y movilizándonos contra este robo masivo, con denuncias colectivas financiadas mediante crowdfunding para poder llevarlo a los tribunales, como el caso, aún en curso, llevado por Karla Ortiz, Sarah Andersen y Kelly McKernan, que avanza por buen camino, o iniciativas como las que están llevando a cabo la federación SEGAP, la Confederación General del Trabajo (CGT) y colectivos como ARTE es ÉTICA o Autoras de Cómic, gracias a los cuales se logró paralizar el Real Decreto para la Inteligencia Artificial que el Ministerio de Cultura español quiso forzar hace poco por lo bajini, para que no se enterase casi nadie, y que hubiese dejado vendidos a todos los profesionales culturales Españoles.
Así que, no es que no se esté haciendo nada, sino que no se está publicitando porque a demasiada gente no le interesa dar publicidad a este tipo de iniciativas que están teniendo los artistas contra viento y marea en todas las partes del mundo.
Además, actualmente hay más de 40 demandas aún en curso en los tribunales que aún no se han resuelto. De momento ya se ha resuelto una de ellas en favor de los derechos de copyright, como es el caso de Thomson Reuters contra Ross Intelligence, en el que se ha declarado que la empresa desarrolladora de la iA ha cometido una infracción por derechos de autor por entrenarla utilizando la base de datos Westlaw, invalidando su defensa que alegaba el uso justo.
Así que eso de que no hay castigo está por ver. Aún hay muchos casos en curso y este caso ha creado un precedente por el cual el resto podrían resolverse por el mismo camino. Es muy pronto para decir que todo esto no va a tener consecuencias para los ladrones de datos.
Xavizzz
Esta gente se mueve a otro nivel, uno donde las leyes se interpretan de otra manera, curiosamente casi siempre a su favor.
Y cuando no es así (para que no sea tan evidente) los castigos son tan ridículos que merece la pena saltarse la ley.
Luego estamos los mortales, que a la mínima nos crujen y sin esas manadas de superabogados poco podemos hacer.
messerpolo
Lo de ilegal y robo está por verse. Acaso un pintor no se basa en las obras anteriores para llegar a donde llega? Un escritor no ha leído antes otros libros para aprender a escribir? La IA no copia, aprende. Podrán denunciar por no haber pagado por leer el libro, si es que eso es así, pero no existe ningún derecho de copyright para que no aprendan de ti.
petote
Es que las leyes son solo para los pobres.
stranno
¿Y quién sale en defensa de los proyectos y las licencias FOSS cuando las empresas grandes se pasan sus derechos por el forro de los cojines? Os lo digo yo: NADIE. Esto es lo de siempre.
Será pocas las veces que han violado las licencias de MAME en cosas de SNK (Playmore), Capcom, Konami, etc. O mismamente la Playstation Classic, que usaba PCSX ReARMed de forma turbia, siendo optimista. Lo gracioso es que son cuatro de las empresas con los mejores ingenieros de software del planeta y ni para emular una plataforma propia les da.
javileyes
El Open Source es el único que tiene derecho de hacer eso. La IA opensource nos empoderará a todos... Con el Open Source + la bandera pirata seremos libres. Que lloren...
fomlimalma
Si todos se roban entre todos pues mejor hay que dejar de llorar
De lo que si hay que protegerse es que china robe la tecnología final como lo hizo con deepseek