🧠 Meta entrenó su IA con libros pirateados: ¿genialidad o robo masivo?

 Meta habría utilizado libros piratas de LibGen para entrenar LLaMA 3. ¿Innovación imparable o una gran patada a los derechos de autor?

En la carrera por liderar la inteligencia artificial, parece que todo vale. Según documentos judiciales recientemente desvelados, Meta usó masivamente contenido de LibGen (una conocida biblioteca pirata de libros y papers científicos) para alimentar su modelo LLaMA 3. La decisión, que según el reportaje de The Atlantic fue validada por el propio Mark Zuckerberg, plantea un debate incómodo: ¿puede una IA ser ética si nace del pirateo?

El atajo de la piratería para entrenar modelos

Cuando Meta se enfrentó al problema de encontrar textos de calidad y en gran volumen para entrenar su IA, las opciones legales resultaron demasiado caras o lentas. Así que optaron por la vía rápida: usar LibGen, una base de datos que contiene más de 7,5 millones de libros y más de 80 millones de artículos académicos obtenidos sin autorización de los autores ni las editoriales.

En lugar de pagar licencias o firmar acuerdos, optaron por lo que internamente se consideró más eficiente. La documentación filtrada sugiere que esta decisión tuvo el visto bueno de los niveles más altos de la compañía, incluyendo al propio CEO.

Las demandas no se han hecho esperar

Autores como Sarah Silverman y Junot Díaz ya han demandado a Meta por infracción de derechos de autor. Denuncian que sus obras se usaron sin permiso para entrenar una IA que, además, podría generar contenido derivado de esos textos, lo que añade otra capa al conflicto legal.

Meta, como otras tecnológicas, se escuda en el “uso justo” (fair use) para justificar estas prácticas. Pero este argumento está aún lejos de resolverse en los tribunales. Y lo que está en juego no es solo un modelo de IA, sino el equilibrio entre innovación tecnológica y respeto por la propiedad intelectual.

¿Avance a cualquier precio?

Más allá del lío legal, lo que hay detrás es una pregunta más profunda:
¿Queremos que el futuro de la IA se construya sobre la explotación de obras ajenas sin permiso?

Desde un punto de vista práctico, entrenar modelos grandes con contenido variado y de calidad es clave para su rendimiento. Pero hacerlo sin compensar a los autores es como construir un rascacielos con ladrillos robados: la obra puede ser impresionante, pero el método deja mucho que desear.

El dilema de siempre: ética vs. velocidad

Lo que Meta ha hecho (y que, seamos sinceros, probablemente también hacen otras empresas) pone en evidencia lo gris del terreno en el que se mueve la IA generativa. Mientras la tecnología avanza a velocidad de crucero, la legislación va con triciclo.

¿La solución? Quizá no sea frenar el progreso, sino establecer nuevas reglas del juego que protejan a los creadores sin frenar la innovación. Pero para eso hace falta voluntad… y tiempo. Y en Silicon Valley, el tiempo es lo único que nadie quiere perder.