La demanda presentada en una Corte Federal de Manhattan el pasado 27 de diciembre de 2023 por el New York Times en contra de OpenAI y de Microsoft, establecerá un precedente trascendental en el futuro de la inteligencia artificial. Lo que está en discusión no es solo la trascendental definición sobre los límites de los derechos de autor, sino la viabilidad misma del modelo de la IA generativa.
Como la mayor parte de los mortales que accedimos al uso del ChatGPT (propiedad de OPenAI), o del nuevo buscador de Bing o al sitio Midjourney hace apenas un año, la pregunta clave que nos formulamos era la de la procedencia, casi mágica, de la información producida por estas herramientas. En el caso del ChatGPT se nos dijo que se trataba de un mecanismo que, basado en barridos de información histórica depositada en internet, era capaz de producir respuestas específicas a preguntas de los usuarios, con niveles sofisticados de precisión y que mejoraban en la medida en la que, predictivamente, aprendían de su propia utilización cotidiana. Midjourney, por su parte, genera diseños gráficos a partir de mezclas de bancos de imágenes para seguir intuitivamente las solicitudes de los usuarios.
En ambos casos, los resultados son impresionantes en calidad y cantidad, partiendo del supuesto de que, basándose en la existencia previa de obras literarias o de imágenes, la máquina es capaz de generar información diferente y “desvinculada” de las obras de las que se alimenta. Es decir, si se compara un texto de IA generativa, o una imagen, con obras previas, podemos decir que no existe violación de copyright porque, en los parámetros convencionales, la obra nueva es suficientemente original como para que no se pueda calificar como derivada de obras primigenias.
El argumento central de la demanda presentada por el NYT en contra de OpenAI y de Microsoft es el uso no autorizado del acervo histórico de artículos del diario para entrenar sus motores de inteligencia artificial. Se trata de miles de artículos que requieren trabajo de preparación de semanas y muchas veces de meses, que estarían siendo utilizados sin permiso, generando pérdidas millonarias a la empresa de medios. Muchos de los artículos, dice la parte demandante, han requerido de traslados de periodistas a los lugares donde los hechos se presentan, con enormes recursos destinados a la producción de la información.
El planteamiento del NYT se puede equiparar a la demanda que en su momento las disqueras y los autores presentaron en contra de Napster, a inicios del 2000, que dio paso a crear el concepto de “puesta a disposición” en las leyes de derechos de autor. Sin ese novedoso abordaje, la infracción de las obras no se presentaba en términos de la legislación aplicable.
En caso de prosperar la demanda, el avance exponencial de la inteligencia artificial generativa sufriría un golpe mortal en uno de sus postulados, que podría derivar en impedir el barrido irrestricto de información de sitios web como lo han venido haciendo, o bien, imponer el pago de regalías como mecanismo de acceso. El punto, como se puede advertir, marcará un antes y un después en el futuro de estas herramientas.
Aunque la defensa no ha manifestado aún su postura, es predecible que la misma invocará como ejes la libertad de expresión y el derecho a la información que la propia red ha reivindicado en todas las formas posibles. Está todo en juego y la moneda en el aire.