Trasteamos con un programa de Inteligencia Artificial para crear imágenes

…Y si ha fallado una inteligencia, no ha sido la artificial…

La curiosidad mató al gato, dice el refrán. En nuestro caso, la curiosidad ha matado al Pulpo, o más bien a su futuro artístico. Y es que nuestra mascota no se ha podido resistir a probar alguno de los programas de Inteligencia Artificial de creación de imágenes de los que nos hicimos eco la semana pasada.

Estas plataformas online se han popularizado los últimos meses gracias a su uso abierto y gratuito; esto es como lo de los folletos en las ferias del IFEMA, que como los dan sin pagar un céntimo, no hay jubilado que no vuelva de allí con un saco de papeles con el que podría forrar las paredes de toda su casa.

En concreto, hemos probado el que posiblemente es el software de este tipo más conocido de todos, DALL-E, que ya de entrada a mí me gana por el doble juego de palabras: El pintor surrealista Dalí (y surrealistas suelen ser las creaciones de este programa), unido al robot protagonista de la película homónima de Pixar, Wall-E, como representante de la inteligencia artificial.

Su uso en principio es bien sencillo: Introduces en un campo del programa lo que quieres que la IA te diseñe, clicas en el botón correspondiente, esperas unos segundos y… ¡voilà! Y digo en principio, porque una cosa es generar un diseño, y otra muy distinta que el diseño no nos produzca vergüencita ajena. Lo vamos a explicar con los ejemplos que hemos probado y, puesto que esto es un blog que pretende hacer reír, nos vamos a comer con patatas lo de la vergüencita…

Para empezar, y por aquello de que uno siempre tiene ilusión por probar en primer lugar algo que le represente, como este que escribe es un friqui del campo y la montaña, lo primero que se le ocurrió fue introducir el concepto “Árbol en la cima de una montaña cuyos frutos tengan forma de montañas”… Supongo que un concepto pretencioso en lo surrealista. Estas fueron las cuatro opciones que resultaron:

1

¿Entendéis ahora por qué sólo en principio es fácil de usar el programita? Efectivamente, por eso mismo: Porque una cosa es que el programa sea bueno, y otra que lo sean las ideas de quien lo usa… En el mejor de los casos (el segundo por la izquierda), la montaña es un montículo de tierra, el árbol un matojo, y los frutos trozos de barro que bien podrían parecer cagarrutas o agallas de las que les salen a los rosales cuando una avispa pone allí sus huevos.

Como se supone que los matices en las explicaciones pueden ayudar a aclararle a la IA lo que en realidad quieres, decidí probar intentando que no creara fotos “realistas” como antes, e introduje la acotación “Ilustración de…” a la propuesta anterior, en la tal vez ilusa idea de que un “pintor” (aunque sea robótico) sí podría crear ese concepto si no lo hace fotorrealista. A pesar de acercarse algo más a lo que buscaba, me temo que volvió a hacerse un lío con lo de los frutos que deberían haber parecido montañas (no que se amontonasen formando montículos):

2

Con este desastre de resultados de prueba, llegó el momento de empezar a requerir imágenes para nuestro propio trabajo, para ilustrar nuestras páginas web con nuestros “propios” diseños. Y como somos así de valientes (entiéndase temerarios), pasamos directamente de esa decepción inicial, sin tener ninguna prueba aceptable, a usar ya una, en concreto para la última entrada de este mismo blog, la del primer test de actualidad tecnológica de la temporada. Nos complicamos bastante menos la vida, sugiriendo a DALL-E que nos diseñara un “Exámen”, a secas. Un concepto, una palabra. Pues oye, ni tan mal:

3

Dejando a un lado el miedo que da el careto del chaval que se está examinando en la foto de la derecha, por lo demás las imágenes valían para ilustrar el test, y así utilizamos la de la izquierda. Con un breve inciso, aclararé que, según explican los entendidos en esta tecnología, la IA no “copia” las imágenes que le sirven de banco de datos, sino que crea las suyas propias a partir de lo que ha aprendido “viéndolas” (a esto lo llaman machine learning). Digo esto porque si uno busca “test” o “examen” en el motor de búsqueda de imágenes de Google, encontrará muchas parecidas a las que creó DALL-E cuando se lo pedimos, con esos lápices sobre papeles con test multirrespuesta; en realidad son las de DALL-E las que se parecen a todas esas (entiendo), y de ahí “se nutre”.

Lo curioso es que si otra persona, en otro lugar del mundo, introduce esa misma palabra sencilla y aislada (“Examen”), se supone que DALL-E crea otras cuatro imágenes distintas. No es que las ideas sean tan originales por parte de los usuarios del programa (salvo excepciones, y yo no soy una con lo del arbolito de la montaña), como para que los diseños sean únicos, es que el algoritmo genera imágenes siempre originales, porque así está diseñado (matemáticamente). No sé cómo lo hará, pero uno se fija en el detalle de los caracteres surrealistas de las opciones de respuesta en los exámenes de las imágenes de antes, y efectivamente es raro, pero raro raro…:

4

Tras ello, llegó el momento de crear imágenes para las noticias de hayCANAL, y aquí entramos en la clásica temática digital, de cuya recurrencia a los topicazos ya hemos hablado en este mismo blog. La primera necesidad fue buscar algo para ilustrar información sobre ciberamenazas, y el resultado resultó por un lado parecido a lo que conocíamos, pero por otro fue extraño al ver cómo la IA se hacía un lío (no sabemos si intencionado) con las letras y las palabras:

5

Algo parecido ocurrió cuando acudimos a requerir diseños sobre otro tema relacionado, y además atestado de ejemplos basados en uno de esos grandes topicazos: El de los ciberdelincuentes representados por tipos encapuchados y demás. Aunque evitamos a toda costa incluir lo de la capucha en la descripción (apenas escribimos eso, “ciberdelincuentes”), no faltó en alguna de las imágenes el diseño predecible. Y, de nuevo, un lío con la caligrafía…:

6

Otro de los conceptos tecnológicos por antonomasia de nuestra era, el del cloud computing, así escrito en el campo de sugerencias, sin más explicaciones ni palabras, dio como resultado, otra vez, cosas muy parecidas a las típicas. Y, otra vez, a un suspenso en lengua:

7

Y hablando de la nube, que al fin y al cabo es parte de nuestra idiosincrasia, quedaba lo más representativo para nuestro blog: Crear diseños nuevos de nuestra querida mascota. Empezamos comprobando que la opción en forma de dibujo daba lugar a imágenes demasiado naíf. Este fue el resultado al introducir “Ilustración de un pulpo en una nube”:

8

La cosa mejoró sustancialmente (y empezó a molarnos por primera vez desde que usamos el programa) cuando decidimos volver al diseño fotográfico: “Fotografía realista de un pulpo en una nube”, pasando por alto lo poco que tiene de realista ese concepto, dio lugar a estas más que aceptables creaciones:

9

Debido a este resultado tan satisfactorio, nos empezamos a flipar y nos pasamos de frenada en el siguiente intento: Para resaltar que el pulpo no sólo está en la nube, sino que, sobre todo, está perdido en la nube, probamos con “Fotografía realista de un pulpo en una nube con un mapa en un tentáculo y una brújula en otro tentáculo”. De ahí sacamos estos, aparentemente currados y "dalinianos", pero un tanto incomprensibles:

10

Sin embargo, la cosa volvió a remontar cuando ese mismo concepto decidimos llevarlo a estilo del dibujo o la ilustración:

11

La conclusión a todo esto es que, por muy inteligente que sea esta inteligencia artificial, el usuario tiene que ir probando con distintas opciones en las sugerencias, y a veces funciona mejor el dibujo, y otras la fotografía (sin que quede muy claro en qué casos va a ser lo uno o lo otro). Por otro lado, el programa tiene consola de edición de imágenes, para que ya cada uno se ponga en plan Photoshop (a tanto no hemos llegado nosotros, ¡que se lo curre la app, que para eso nos la hemos instalado!).

En fin, seguiremos probando. Puede que hagamos otra entrada cuando ya lo dominemos mejor (si es que eso llega a ocurrir), o simplemente que vayamos dejando alguna que otra imagen en el blog del Pulpo o en hayCANAL generada por este sistema (para horror y sonrojo de nuestros seguidores). Quizá también probemos otros programas (entonces sí que habrá nuevo post por aquí para contarlo, seguramente). En cualquier caso, una nueva era se abre a la humanidad, y ya veremos a donde nos lleva. A nosotros, de momento, a entretenernos un poco más.

P.D.: La imagen de portada de este post ha sido la última de las imágenes que hemos creado con DALL-E: “Robot pintando un cuadro”. Muy apropiado, claro.