Meta habr铆a utilizado libros piratas de LibGen para entrenar LLaMA 3. ¿Innovaci贸n imparable o una gran patada a los derechos de autor?
En la carrera por liderar la inteligencia artificial, parece que todo vale. Seg煤n documentos judiciales recientemente desvelados, Meta us贸 masivamente contenido de LibGen (una conocida biblioteca pirata de libros y papers cient铆ficos) para alimentar su modelo LLaMA 3. La decisi贸n, que seg煤n el reportaje de The Atlantic fue validada por el propio Mark Zuckerberg, plantea un debate inc贸modo: ¿puede una IA ser 茅tica si nace del pirateo?
El atajo de la pirater铆a para entrenar modelos
Cuando Meta se enfrent贸 al problema de encontrar textos de calidad y en gran volumen para entrenar su IA, las opciones legales resultaron demasiado caras o lentas. As铆 que optaron por la v铆a r谩pida: usar LibGen, una base de datos que contiene m谩s de 7,5 millones de libros y m谩s de 80 millones de art铆culos acad茅micos obtenidos sin autorizaci贸n de los autores ni las editoriales.
En lugar de pagar licencias o firmar acuerdos, optaron por lo que internamente se consider贸 m谩s eficiente. La documentaci贸n filtrada sugiere que esta decisi贸n tuvo el visto bueno de los niveles m谩s altos de la compa帽铆a, incluyendo al propio CEO.
Las demandas no se han hecho esperar
Autores como Sarah Silverman y Junot D铆az ya han demandado a Meta por infracci贸n de derechos de autor. Denuncian que sus obras se usaron sin permiso para entrenar una IA que, adem谩s, podr铆a generar contenido derivado de esos textos, lo que a帽ade otra capa al conflicto legal.
Meta, como otras tecnol贸gicas, se escuda en el “uso justo” (fair use) para justificar estas pr谩cticas. Pero este argumento est谩 a煤n lejos de resolverse en los tribunales. Y lo que est谩 en juego no es solo un modelo de IA, sino el equilibrio entre innovaci贸n tecnol贸gica y respeto por la propiedad intelectual.
¿Avance a cualquier precio?
M谩s all谩 del l铆o legal, lo que hay detr谩s es una pregunta m谩s profunda:
¿Queremos que el futuro de la IA se construya sobre la explotaci贸n de obras ajenas sin permiso?
Desde un punto de vista pr谩ctico, entrenar modelos grandes con contenido variado y de calidad es clave para su rendimiento. Pero hacerlo sin compensar a los autores es como construir un rascacielos con ladrillos robados: la obra puede ser impresionante, pero el m茅todo deja mucho que desear.
El dilema de siempre: 茅tica vs. velocidad
Lo que Meta ha hecho (y que, seamos sinceros, probablemente tambi茅n hacen otras empresas) pone en evidencia lo gris del terreno en el que se mueve la IA generativa. Mientras la tecnolog铆a avanza a velocidad de crucero, la legislaci贸n va con triciclo.
¿La soluci贸n? Quiz谩 no sea frenar el progreso, sino establecer nuevas reglas del juego que protejan a los creadores sin frenar la innovaci贸n. Pero para eso hace falta voluntad… y tiempo. Y en Silicon Valley, el tiempo es lo 煤nico que nadie quiere perder.