Dall-E mini: la inteligencia artificial que puso de cabeza a los artistas, el ‘copyright’ e internet

Voldemort cortándose el cabello“, “Diego Maradona jugando en la NBA“, “Un boceto de la audiencia de Snoopy demandando a Snoop Dog“. Si a un internauta se le pasaba por la cabeza buscar imágenes con estas descabelladas frases en la red, seguramente no encuentre ningún resultado ni remotamente cercano. Hasta hace unos días…

Las citadas arriba son algunas de las búsquedas que ha recibido Dall-E mini, una inteligencia artifical (IA) que genera imágenes procesando miles de millones de imágenes en su base de datos, y que actualmente es de libre acceso. Para casos tan absurdos como “Policía interrogando a un tarro de pepinillos“, Dall-E mini ha creado imágenes “propias” con resultados sorprendentes, y que en algunos casos (con los reparos propios de un generador de este estilo de libre acceso) se acercan a un resultado bastante decente.

Dall-E mini
Resultado de buscar en Dall-E mini “Policía interrogando a un tarro de pepinillos“.

Pero las imágenes arrojadas por Dall-E han planteado preguntas sobre los avances de la inteligencia artificial, el futuro del arte y los artistas y los vacíos en la legislación sobre derechos de autor.

¿Cómo funciona Dall-E mini?

Dall-E mini es un generador de imágenes a partir de texto. Esto quiere decir que, basado en algoritmos de redes neuronales artificiales, procesa un enunciado para crear lo que considera que es su representación visual más fiel. Como es posible que el texto se preste para más de una interpretación (incluso para una inteligencia artificial), los generadores de imágenes suelen ofrecer más de un resultado. En el caso de Dall-E mini, el generador presenta nueve imágenes posibles.

Dall-E mini
Dall-E mini utiliza su algoritmo de procesamiento de lenguaje para generar imágenes inéditas en internet.

El nombre está inpirado en los del personaje de Pixar Wall-E y el pintor surrealista Salvador Dalí. Puede acceder a Dall-E mini haciendo click aquí.

Otros generadores de imagen artificiales

A pesar de haber sacudido internet con búsquedas virales, Dall-E mini no es el primer proyecto de este estilo. En las últimas décadas, investigaciones relacionadas con el procesamiento del lenguaje, la programación y las redes neuronales artificiales han desarrollado generadores de imágenes. Es el caso de proyectos como AttnGAN, que han mostrado, de paso, las dificultades para conseguir una imagen a partir del análisis de monumentales bases de datos.

Pero los mayores pasos los han dado Google y OpenAI. Esta última es la companía de inteligencia artificial detrás de Dall-E mini, que no es más que la versión “de bolsillo” de sus mayores proyectos: Dall-E y Dall-E 2. Como la versión mini, estos dos generadores de imágenes utilizan el algoritmo GPT-3, que genera texto parecido al que un humano podría producir, pero ofrecen resultados mucho más realistas. Los internautas han corroborado que, en comparación, Dall-E mini tiene problemas para generar rostros y animales (muchos de los resultados Dall-E mini son perturbadores por esta razón).

Para acceder a Dall-E 2 hay que entrar a una lista de espera virtual aquí.

Por su parte, Google ha desarrollado Imagen, un modelo de difusión con el que, según Brain Team, investigador de la compañía, consigue “un grado de fotorrealismo sin precedentes y un nivel profundo de comprensión del lenguaje“. Para conseguir los resultados, Google utiliza sus propios modelos de texto y, como en el caso de OpenAI, un repositorio de imágenes propio.

Imagen, generador de imágenes de Google.
Imagen es el generador de imágenes de Google. Estos son los resultados del algoritmo al pedirle una imagen de “Una cobra gigante en una granja. La serpiente está hecha de maíz“, y “Osos de peluche nadando en el evento de 400 metros mariposa en los Olímpicos“.

Dall-E mini: ¿los resultados son arte?

Desde hace décadas, el arte generado por computadora se ha hecho un lugar en los movimientos contemporáneos. En los sesenta, en Alemania y Estados Unidos se utilizaron computadoras para realizar piezas como ‘Plastik 1‘, de Georg Nees. Nees utilizó un generador de números aleatorio para realizar su escultura, que actualmente se encuentra en el museo V&A.

Obras de arte realizadas a partir de la programación también han sacudido el mercado de las subastas, como ‘Edmond de Belamy‘, creada por el colectivo Obvious y vendida en 432.500 dólares, o ‘Nude Portrait#7Frame#64‘, de Robbie Barrat y vendida en el Sotheby por 821.000 dólares.

Uno de los ejemplos más controvertidos es el de Helena Sarin, una inteligencia artificial curada para realizar obras de arte originales.

Pero la situación con generadores de imágenes como Dall-E es más conflictiva. Las imágenes que producen son realistas y exactas en muchos casos, sorteando problemas técnicos que han inquietado a artistas durante siglos y, aparentemente, abriendo nuevos horizontes en términos de composición e imaginería.

Pese a esto, los generadores de imagen eliminan el proceso creativo, elemento esencial para comprender la historia del arte y las motivaciones detrás de una obra. Como señala Aaron Hertzmann en The Conversation, “debatimos sobre obras de arte a partir de la intención del artista. El artista quiso mostrar una cosa, o expresar una emoción, y por eso hizo la imagen. Dall-E 2 se salta ese proceso por completo: tienes una idea y la escribes, y ya está“.

En todo caso, como apunta Hertzmann, la discusión alrededor del valor artístico de estos generadores recuerda al debate sobre la fotografía, en donde se acusaba a una máquina de hacer todo el trabajo. Como respuesta a esta controversia, artistas y arquitectos han comenzado a utilizar estos generadores como detonantes de nuevas ideas.

La artista Danielle Baskin ha usado Dall-E para recrear, satírica, un nuevo sistema de transporte en San Francisco: un tren que atraviese el Golden Gate.

Por su parte, el arquitecto español Manuel Ladron de Guevara, generó junto con Aaron Hertzmann ideas basadas en el trabajo de Marc Fornes, Le Corbusier o o el estudio SelgasCano.

Generadores de imágenes y derechos de autor

De paso, los resultados de estos generadores han causado inquietudes sobre la atribución de los derechos de las imágenes creadas y el uso de creaciones de terceros.

Las quejas sobre la similitud de las imágenes creadas por Dall-E mini no se han hecho esperar. El problema está en definir en qué medida el algoritmo se basa en una de las imágenes de su base de datos para crear su versión. En concreto, el algoritmo de Dall-E mini ha sido entrenado, utilizado datasets abiertos como el YFCC100M, de casi 100 millones de fotos sacadas de Flickr.

Además, estas imágenes, sujetas a licencias Creative Commons, no pueden ser protegidas de procesos como los de Dall-E mini. Para la Organización Mundial de la Propiedad Intelectual (OMPI), un programa no puede ser el autor de una obra creativa. En consecuencia, las imágenes que produce Dall-E mini están, por ahora, fuera de cualquier legislación sobre propiedad intelectual.

¿Hay solución? Como señala Enrique Pérez en Xataka, “Microsoft ofrece algo que OpenAI todavía no: un detector de duplicación“, una herramienta de sus generadores de imágenes que “ofrece la posibilidad de ‘incluir la atribución adecuada o decidir no utilizar el código en modo alguno’“.

Otra opción que se baraja es “la creación de un derecho de autor de nueva creación por la utilización masiva por IA para casos concretos“.

¿Reemplazarán a los humanos?

Por último, otro dilema con estos algoritmos viene por cuenta del posible reemplazo de actividades realizadas por humanos. Ya se ha comentado su repercusión en el sector artístico, pero también se baraja la posibidad de usarlos en ámbitos publicitarios o de creación de imágenes corporativas, por poner algunos ejemplos.

La discusión se comprende si se tienen en cuenta antecedentes en otros sectores creativos, como es el caso de la creación de guiones o argumentos. Es el caso de herramientas como Storybase (antes conocida como Plots Unlimited) o Dramatica, que toman todas las decisiones por el usuario de la plataforma, quien solo debe indicar el punto de partida de la historia que tiene en mente.

Incluso, en China, inteligencias artificales han presentado noticias o son utilizadas como redactores de artículos informativos en algunos medios.

2 Comentarios

  1. La respuesta de regulación de nuevas tecnologías ha sido muy lenta, desde el control de ciclomotores o drones, la legislación todavía está tratando de regular estas tecnologías con materiales tangibles, pero cuando se habla de avances tecnológicos digitales es incluso más lenta o nula, como las grandes plataformas de Facebook, Google, entre otras. Google por iniciativa misma de trabajadores crearon una unidad de ética, pero si no es obligatorio hasta qué punto se debe esperar a que las empresas sean las que se limiten así mismos.
    En términos de inteligencia artificial hablaríamos desde millones de datos que deberían pasar por filtros de regulación, se puede decir que facebook funciona en escala menores a las que alcanzan estos motores, y lleva más de dos décadas sin poder establecer una solución.

Deja un comentario

Diario Criterio