La corte federal regula la capacitación de IA con libros con derechos de autor uso justo: tecnología del campus

La corte federal regula la capacitación de IA con libros con derechos de autor. Uso justo

Un juez federal dictaminó que la compañía de inteligencia artificial Anthrope no violó la ley de derechos de autor cuando usó libros con derechos de autor para capacitar a su chatbot Claude sin el consentimiento del autor, pero ordenó a la compañía que enfrentara el juicio sobre las acusaciones que utilizó versiones pirateadas de los libros.

El juez William Alsup, del Tribunal de Distrito de los Estados Unidos para el Distrito Norte de California, emitió el fallo el lunes en una demanda presentada por tres autores contra Anthrope. La decisión representa un desarrollo significativo para las empresas de IA que enfrentan litigios de derechos de autor sobre sus métodos de capacitación.

Determinación del uso justo de la corte

Alsup dictaminó que el uso de Anthrope de libros con derechos de autor para capacitar a sus grandes modelos de idiomas constituía un uso justo bajo la ley de derechos de autor, un hallazgo que evocaba la batalla de principios de la década de 2000 entre Google y el gremio del autor sobre el proyecto de escaneo de libros de Google Books. El juez comparó la práctica de Anthrope con un aspirante a escritor que leyó textos con derechos de autor «para no correr por delante y replicar o suplantar» esas obras «, sino para girar una esquina dura y crear algo diferente».





La demanda fue presentada por los autores Andrea Bartz, Charles Graeber y Kirk Wallace Johnson, quienes alegó que Anthrope usó su trabajo sin consentimiento en lo que denominaron «robo a escala de grandes».

Si el juez Alsup dictaminó que el uso de libros con derechos de autor para la capacitación de IA constituía una infracción de derechos de autor, habría alterado fundamentalmente el panorama de desarrollo de IA. Es probable que las empresas se habrían enfrentado a dos rutas principales: negociar acuerdos de licencia costosos con editores y autores para datos de capacitación, o pivotar para usar solo materiales de dominio público y contenido original.

El enfoque de licencia habría creado barreras de entrada significativas para compañías de inteligencia artificial más pequeñas, mientras que potencialmente beneficiaron a los jugadores establecidos con bolsillos más profundos. Podríamos haber visto el surgimiento de consorcios masivos de licencias de contenido, similar a la forma en que los servicios de transmisión de música negocian con sellos discográficos. Los editores y autores habrían ganado un apalancamiento sustancial y nuevas fuentes de ingresos de las compañías de IA.

Alternativamente, si las empresas se hubieran visto obligadas a confiar principalmente en el contenido de dominio público, los modelos de IA podrían haberse desarrollado de manera diferente, potencialmente con los límites de conocimiento mucho antes en la historia, o con lagunas notables en la comprensión contemporánea. Esto podría haber llevado a un ecosistema de IA bifurcado donde algunos modelos tenían acceso al conocimiento moderno a través de licencias costosas, mientras que otros permanecieron limitados al contenido más antiguo y gratuito.

Acusaciones de piratería para proceder

Mientras desestimó los reclamos de infracción de derechos de autor, Alsup ordenó a Anthrope que enfrentara un juicio sobre las acusaciones que a sabiendas obtuvo copias de más de 7 millones de libros de sitios web de piratería. La compañía luego compró copias de algunos libros, según documentos judiciales.

El juez expresó escepticismo sobre la defensa de la piratería de la compañía, afirmando que dudaba que «cualquier infractor acusado podría cumplir con su carga de explicar por qué descargar copias de origen de los sitios piratas que podría haber comprado o acceder de otra manera era razonablemente necesario para cualquier uso justo posterior».

«Ese antrópico luego compró una copia de un libro que antes robó Internet no lo absorbió de responsabilidad por el robo, pero puede afectar el alcance de los daños legales», agregó Alsup.

Respuesta de la empresa

Anthrope dijo en un comunicado que se complació que el tribunal reconoció que usar trabajos publicados para capacitar a modelos de idiomas grandes era consistente con las leyes de derechos de autor «al permitir la creatividad y fomentar el progreso científico».

La compañía no estuvo de acuerdo con la decisión de proceder a juicio con respecto a su «adquisición de un subconjunto de libros y cómo se usaron», y dijo que estaba «evaluando todas las opciones».

Si el tribunal también hubiera desestimado las acusaciones de piratería, esencialmente habría dado a las compañías de IA una luz verde para adquirir datos de capacitación a través de cualquier medio necesario, siempre que el uso final se califique como un uso justo. Esto podría haber establecido un precedente problemático en el que el método para obtener material con derechos de autor se volvió irrelevante si el uso final se considerara transformador.

Tal resultado podría haber fomentado prácticas de adquisición de datos más agresivas en toda la industria y potencialmente socavar los mercados de contenido tradicionales. Podría haber creado una situación en la que la piratería se convirtió en un método aceptable de facto para obtener datos de capacitación, siempre que las empresas pudieran argumentar un uso justo para sus sistemas de IA.

Fondo

Según los documentos judiciales, después de que surgieron preocupaciones internas sobre el uso de libros pirateados, Anthrope contrató al ex ejecutivo de Google Books Tom Turvey para obtener «todos los libros del mundo» mientras evita problemas legales.

En lugar de buscar acuerdos de licencia comercial con editores, la compañía compró millones de libros impresos de los minoristas, muchos de los usos y luego los escanearon en forma digital. Alsup señaló que la compañía podría haber contratado al personal para crear contenido original para la capacitación, pero eso habría «requerido gastar más».

Los autores que presentaron la demanda dijeron que las acciones de Anthrope hicieron «una burla de sus altos objetivos».

Sobre el autor



John K. Waters es el editor en jefe de varios sitios de converge360.com, con un enfoque en el desarrollo de alta gama, la IA y la tecnología futura. Ha estado escribiendo sobre tecnologías de vanguardia y cultura de Silicon Valley durante más de dos décadas, y ha escrito más de una docena de libros. También co-scrito la película documental Silicon Valley: un renacimiento de 100 añosque se emitió en PBS. Se le puede contactar en [email protected].




We use cookies in order to give you the best possible experience on our website. By continuing to use this site, you agree to our use of cookies.
Accept