El Atlánticoha lanzado una nueva base de datos que visibiliza la música utilizada en el entrenamiento de modelos de inteligencia artificial. Creada por el periodista Alex Reisner, la herramienta reúne cuatro conjuntos de datos diferentes que circulan entre los desarrolladores de inteligencia artificial. Hace que se puedan buscar más de 21 millones de canciones. De este modo, los artistas y los titulares de derechos pueden comprobar si sus obras están incluidas en estos conjuntos de datos.
en la base de datos Taylor Swift, Billie Eilish, Nirvana, Bad Bunny, Pearl Jam Y los beatles Además de nombres como estos, también hay obras de músicos independientes. Los dos conjuntos de datos más grandes constan de aproximadamente 12 millones y 9 millones de elementos, respectivamente, mientras que los otros dos grupos contienen más de 100 mil registros cada uno.
Según The Atlantic, tres de los conjuntos de datos contienen enlaces a YouTube y Spotify, no archivos de audio directos. Los desarrolladores de inteligencia artificial descargan estos contenidos con varias herramientas automáticas y los convierten en datos de entrenamiento. Algunas de estas herramientas entran en conflicto con los términos de uso de YouTube y Spotify, ya que pueden eludir la publicidad, la verificación de inicio de sesión y los mecanismos de ingresos de las plataformas.
Si bien la investigación indicó que los conjuntos de datos se descargaron miles de veces, se desconoce en gran medida qué empresas los utilizaron. Sin embargo, Google y Stability AI han confirmado previamente que utilizan estos conjuntos de datos en algunas de sus investigaciones.
La nueva herramienta también es importante en términos de las discusiones en curso sobre derechos de autor en la industria de la música. Grandes compañías discográficas como Universal Music Group, Sony Music y Warner Music han presentado demandas contra las plataformas de producción musical respaldadas por inteligencia artificial Suno y Udio por infracción de derechos de autor. La base de datos preparada por The Atlantic puede allanar el camino para que surjan nuevas pruebas en estos casos al brindar a los titulares de derechos la oportunidad de examinar concretamente si sus obras se utilizan en la educación sobre inteligencia artificial.
La herramienta no se limita sólo a la música. Se ofrecen capacidades de búsqueda similares para libros y otros medios como parte de la iniciativa «AI Watchdog» de The Atlantic.
Imagen: ChatGPT
