Notasbit

Las mejores noticias de tecnología en un sólo lugar

Publicado por: Genbeta

Publicado en: 07/02/2025 09:15

Escrito por: Bárbara Bécares

"Descargar con torrents desde un portátil de la empresa no es buena idea": Meta descargó 81,7 TB de libros con copyright para su IA

Hace unos días veíamos que Meta entrenó a su chatbot usando libros con copyright sacados de una web de descargas y que fue con el visto bueno de Mark Zuckerberg. Documentos recientemente desclasificados en el caso Kadrey vs. Meta revelan que la empresa habría utilizado obras protegidas por derechos de autor... Y hoy se han descubierto nuevas informaciones más concretas al respecto.

El proceso legal Kadrey contra Meta acusa a la empresa de redes sociales de haber utilizado obras protegidas por los derechos de autor para entrenar sus modelos de inteligencia artificial. Y ahora se ha podido saber que lo hacían desde BitTorrent.

Incluso, como recoge Xataka, Nikolay Bashlykov, uno de los responsables de llevar a cabo esta recolección de datos, llegó a bromear con sus compañeros (en abril de 2023) que "descargar con torrents desde un portátil de la empresa no parece buena idea" recordando que la empresa debería tener cuidado con la IP desde la que descargaban los datos.

La enorme cantidad de datos

El mes pasado, Meta admitió haber descargado mediante torrent un controvertido conjunto de datos de gran tamaño conocido como LibGen, que incluye decenas de millones de libros con derechos de autoría. Pero los detalles en torno a los torrents eran confusos hasta ayer, cuando los correos electrónicos sin redactar de Meta se hicieron públicos por primera vez.

La nueva evidencia mostró que Meta transfirió "al menos 81,7 terabytes de datos a través de múltiples bibliotecas paralelas a través del sitio Anna's Archive, incluidos al …

Top noticias del 7 de Febrero de 2025