Blog elhacker.NET: Demandan a NVIDIA por haber recurrido a 500 TB de libros pirateados para entrenar la IA

Demandan a NVIDIA por haber recurrido a 500 TB de libros pirateados para entrenar la IA

domingo, 25 de enero de 2026 | Publicado por el-brujo | Editar entrada

NVIDIA enfrenta una demanda en EE.UU. por usar 500 TB de libros pirateados para entrenar sus modelos de IA, un caso similar al de Meta, que también fue acusada de prácticas similares.

Hemos conocido que NVIDIA se enfrenta a una demanda interpuesta en el Distrito Norte de California, Estados Unidos, por usar libros pirateados para entrenar modelos de IA. Realmente esta noticia no debería coger a nadie por sorpresa. Hay que recordar que Meta (Facebook), también fue acusa de utilizar BitTorrent para descargar libros pirateados para entrenar su modelo de IA (Llama). Pero la cosa va más allá.

Para que tengas el contexto del caso de NVIDIA, también se les ha acusado a OpenAI (ChatGPT), Microsoft (Copilot), Anthropic (Claude), Google (Gemini) o Apple, por recurrir a noticias, estudios o libros con propiedad intelectual sin haber adquirido los derechos. Incluso los modelos relacionados a la generación de imágenes, como Stability AI, Midjourney o DeviantArt, también tienen demandas similares. Pero en este caso, con todo el contenido relacionado a los artistas. Los cuales vieron como estos modelos de IA fueron entrenadas con sus imágenes sin permiso. En esencia, no es una sorpresa que el gran avance que ha dado la IA en un año es gracias a "haber robado" toda la información que existe en internet.

La demanda indica que NVIDIA recurrió a unos 500 TB de libros pirateados para entrenar sus modelos de IA

Volviendo a la historia, NVIDIA se enfrenta a una demanda colectiva ampliada en la que varios autores le acusan de haber copiado y usado obras con copyright para entrenar modelos de IA, incluyendo material procedente de “bibliotecas ocultas” como The Pile, Bibliotik/Books3 y Anna’s Archive. Según se recoge en la demanda, fue en el año 2023, cuando NVIDIA habría estado bajo presión competitiva para llegar con un modelo de lenguaje (LLM) “grande” a una fecha interna relevante (su evento de desarrolladores).

Teniendo como referencia ese contexto, se habría vuelto hiper dependiente de la información almacenada en los libros para alcanzar objetivos de escala (tokens). La demanda también recoge que NVIDIA intentó hablar con las editoriales para lograr el acceso rápido a grandes volúmenes de libros, pero que no habría conseguido cerrar los acuerdos de licencia a tiempo para cumplir con sus plazos internos. Debido a ello, aparece en juego una de estas bibliotecas ocultas, Anna's Archive, quien aseguró que NVIDIA habría contactado con ellos.

Anna’s Archive sufrió la suspensión de su dominio este enero de 2026. Posee cerca de 62 millones de libros y unos 96 millones de artículos con un tamaño listado de 1,1 petabytes, es decir, 1.100 TB. Por lo que NVIDIA habría recurrido a casi la mitad de esta información. La demanda indica que Anna’s Archive recibió una petición de NVIIDA para tener acceso acelerado a su contenido, lo que la demanda enmarca como una vía de “piratería de pago”. Si bien la biblioteca advirtió que su colección de contenido era ilegal y solicitó una confirmación de compra, una semana más tarde, NVIDIA habría recibido "luz verde" para acceder a millones de libros.

Anna’s Archive prometió acceder a al menos 500 TB de libros

El escrito asegura que Anna’s Archive prometió a NVIDIA acceso a "muchos libros", en concreto, unos 500 TB de datos. Ahora bien, no queda claro si NVIDIA llegó a pagar para acceder a la información. Además, la demanda amplía el foco y sostiene que, además de Anna’s Archive y The Pile/Books3, NVIDIA habría tenido también acceso a otras bibliotecas sombra como LibGen, Sci-Hub y Z-Library. Además de que también habría facilitado a clientes corporativos las herramientas/scripts necesarios para descargar datasets.

En cuanto al caso, no es más que una nueva demanda de una gran compañía tecnológica relacionada con la IA (NVIDIA) que habría recurrido a material pirata para no quedarse atrás en la carrera de la IA. Ahora bien, los precedentes adelantan que aquí no pasará nada.

En el caso de Meta, desde 2025 no se sabe nada más allá de que el juez había denegado la moción de los demandantes. En el caso de OpenAI + Microsoft, puede que hayan actualizaciones entre enero o febrero de este año. Aunque Anthropic es de los pocos que pagarían una "multa". En concreto un acuerdo de 1.500 millones de dólares por recurrir a libros pirateados, pero este acuerdo no se ha cumplido ya que un juez federal no lo aprobó en su momento a la espera de más detalles. Así que, por ahora, se desconoce cómo ha evolucionado la cosa. Pero ninguna gran compañía, hasta ahora, ha pagado una multa por usar libros o material pirateado.

Fuentes:
https://elchapuzasinformatico.com/2026/01/demanda-nvidia-libros-pirateados-entrenar-ia/

Etiquetas: demanda , entrenamiento , IA , libro , piratería , tecnología

0 comentarios :

Publicar un comentario

Los comentarios pueden ser revisados en cualquier momento por los moderadores.

Serán publicados aquellos que cumplan las siguientes condiciones:
- Comentario acorde al contenido del post.
- Prohibido mensajes de tipo SPAM.
- Evite incluir links innecesarios en su comentario.
- Contenidos ofensivos, amenazas e insultos no serán permitidos.

Debe saber que los comentarios de los lectores no reflejan necesariamente la opinión del STAFF.

Productos FTTH

Tutoriales y Manuales

Entradas Mensuales

Síguenos en:

Blogroll

Etiquetas

Entradas populares

Demandan a NVIDIA por haber recurrido a 500 TB de libros pirateados para entrenar la IA

La demanda indica que NVIDIA recurrió a unos 500 TB de libros pirateados para entrenar sus modelos de IA

Anna’s Archive prometió acceder a al menos 500 TB de libros

0 comentarios :

Publicar un comentario