El combate New York Times VS ChatGPT encara un nuevo asalto. OpenAI ha publicado un duro escrito en el que defiende las «regurgitaciones» (resultados exáctamente iguales ofrecidos por ChatGPT a contenidos con derechos de autor) y acusa al New York Times de no estar contando toda la historia acerca de sus relaciones dentro del marco de la demanda interpuesta por el periódico a la empresa responsable de ChatGPT.

Además, OpenAI ha declarado que es imposible crear herramientas avanzadas de IA como ChatGPT sin utilizar material protegido por derechos de autor, en medio de un creciente escrutinio y demandas de numerosas empresas y autores en contra del supuesto plagio y robo que cometen las inteligencias artificiales generativas en su entrenamiento.

Relacionado: El New York Times demanda a OpenAI

New York Times VS ChatGPT: OpenAI afirma que el NYT «no está contando toda la historia» y que no juega limpio

OpenAI ha publicado un artículo con cuatro ideas fundamentales para defenderse de las acusaciones de plagio vertidas por el New York Times:

  1. Colaboramos con organizaciones de noticias y estamos creando nuevas oportunidades
  2. El entrenamiento es un uso legítimo, pero ofrecemos una opción de exclusión porque es lo correcto.
  3. La «regurgitación» es un error raro que estamos trabajando para reducir a cero.
  4. El New York Times no está contando toda la historia

En su demanda, el NYT menciona que los modelos lingüísticos de OpenAI pueden generar copias literales de su trabajo. Los ejemplos citados en la acusación incluyen artículos que tienen varios años y que también pueden encontrarse en varios sitios web.

Además, OpenAI afirma en su comunicado (que puedes leer íntegro aquí) que el New York Times manipuló los prompts para lograr que ChatGPT incluyera extractos idénticos provocar intencionadamente una infracción de los derechos de autor.

«Las regurgitaciones inducidas por The New York Times parecen proceder de artículos de hace años que han proliferado en múltiples sitios web de terceros. Parece que manipularon intencionadamente las instrucciones, que a menudo incluían largos extractos de artículos, para conseguir que nuestro modelo regurgitara. Incluso cuando se utilizan esas instrucciones, nuestros modelos no suelen comportarse como insinúa The New York Times, lo que sugiere que o bien dieron instrucciones al modelo para que regurgitara o bien seleccionaron sus ejemplos de entre muchos intentos».

La empresa responsable del chatbot más famoso del mundo se apoya en la doctrina legal del «uso justo», afirmando que las leyes de derechos de autor no prohíben el entrenamiento de IA, lo que indica una estrategia de defensa contra las demandas.

OpenAI ha aprovechado para, con cierta chulería soterrada, dejar claro que la contribución del New York Times no es tan importante en ChatGPT. Los grandes modelos de IA aprenden del «enorme conjunto de conocimientos humanos» y cualquier contenido de entrenamiento es sólo una contribución «minúscula» al rendimiento del modelo, dice la empresa, que ha reiterado que los artículos del New York Times «no son significativos» para entrenar modelos de IA como GPT-4.

OpenAI ha destacado la omnipresencia de los derechos de autor en los contenidos digitales, haciendo hincapié en la necesidad de utilizar dichos materiales para entrenar IA sofisticadas como GPT-4.El New York Times demanda a OpenAI y ChatGPT

La empresa se enfrenta a demandas del New York Times y de autores que alegan el uso ilegal de contenidos protegidos por derechos de autor, lo que supone un creciente desafío legal en la industria de la IA.

OpenAI argumenta que restringir los datos de entrenamiento a materiales de dominio público daría lugar a sistemas de IA inadecuados, incapaces de satisfacer las necesidades modernas.

En las últimas semanas, OpenAI ha cerrado acuerdos con empresas editoras como Associated Press, Axel Springer, American Journalism Project y NYU, los cuáles han sido criticados por ofrecer una remuneración bastante baja a cambio de poder acceder a todos sus contenidos.

Entre las reacciones a favor y en contra del modo en el que OpenAI y otras inteligencias artificiales generativas entrenan a sus modelos destaca una corriente que se plantea la siguiente pregunta: ¿En qué se diferencia el entrenamiento de una inteligencia artificial en el ejercicio de mirar un montón de obras de arte y luego desarrollar un estilo influenciado por varios artistas?

Si el producto final es lo suficientemente distinto, muchos opinan que estamos hablando de tareas similares.