La inteligencia artificial Dall-E convierte en imagen cualquier idea que puedas expresar en una fraseNacho Palou 21 abril, 2022 Generar imágenes fotorrealistas a partir de conceptos expresados de forma natural como “un astronauta montado a caballo” o “un plato de sopa que parezca un monstruo”. Y cualquier otra cosa que puedas imaginar, por surrealista que sea. Es lo que hace Dall-E 2, la última evolución del sistema de inteligencia artificial (IA) anunciado por la compañía de investigación y desarrollo OpenAI, que tiene a Elon Musk entre sus fundadores. Es verdad que ya antes hemos visto apps y sistemas de AI similares, que generan imágenes a partir de un texto o palabra clave. Pero la última demo de Dall-E genera unas imágenes que no dejan indiferente a nadie por su calidad y realismo, y también por su estilo onírico y surrealista. El nombre Dall-E combina los nombres del personaje de Pixar Wall-E y de Salvador Dalí, maestro del surrealismo. La herramienta está disponible para el público mediante requiere registro, aunque también se pueden ver libremente sus resultados en la web de OpenAI y en su cuenta de Instagram. Algunas de las imágenes generadas por el modelo de IA Dall-E, de OpenAI La compañía ha compartido ejemplos de las imágenes que produce Dall-E cuando se combinan en una frase breve conceptos, características y estilos. De este modo la frase “un plato de sopa que parece un monstruo hecho con plastilina” daría como resultado esta imagen y sus variantes Imagen generada por la IA Dall-E cuando interpreta la frase «un plato de sopa que parece un monstruo hecho con plastilina”. Imagen: OpenAI Mientras que “un plato de sopa que parece un monstruo tejido con lana” resultaría en esta otra imagen —y sus variantes. Imagen generada por la inteligencia artificial Dall-E en respuesta a la frase “un plato de sopa que parece un monstruo tejido con lana”. Imagen: OpenAI Se pueden probar diferentes combinaciones en la web de OpenAI, y en este video se pueden ver otros ejemplos y se explica un poco más sobre qué es y cómo funciona Dall-E. Cómo funciona Dall-E La red neuronal de Dall-E “ha aprendido la relación entre las imágenes y los textos que las describen”, explican los investigadores. “No solo entiende objetos individuales como un caballo o un astronauta”, dicen, sino que también ha aprendido “cómo los objetos y las acciones se relacionan entre sí”. De este modo es como Dall-E ‘sabe’ cómo debe representar de forma realista un astronauta montando a caballo.Para generar la imagen Dall-E utiliza un proceso llamado “difusión” que comienza reorganizando patrones de puntos aleatorios que va modificando hasta obtener el resultado deseado y producir “imágenes que no han existido antes”. Dall-E genera varias versiones de la imagen que genera por cada idea que recibe. También se puede definir el estilo para que el resultado sea una imagen dibujada a lápiz, por ejemplo. Imagen: OpenAI Dall-E es un ejemplo “de cómo la imaginación humana y los sistemas pueden trabajar juntos para crear cosas nuevas, amplificando nuestro potencial creativo” Dall-E aspira a ser un ejemplo de IA “útil y segura” Para los investigadores el desarrollo de Dall-E cumple tres premisas esenciales para el desarrollo de una IA “útil y segura”: Permite que el público se exprese de un modo que hasta ahora no era posible.Revela si el sistema de IA “entiende” lo que se le pide por escrito, o si por el contrario solo repite lo aprendido.Ayuda a entender de qué manera ve y entiende el mundo el sistema de IA. Respecto a la primera versión de Dall-E, anunciada hace algo más de un año, Dall-E 2 añade nuevas funciones, además de incrementar la comprensión y la calidad y complejidad de las imágenes y la velocidad a la que se generan. Puede partir de una imagen ya existente y crear variaciones complejas, como por ejemplo cambiar el ángulo de un retrato y su estiloPermite editar una imagen existente para reemplazar un objeto por otro, para añadir un objeto que no existe en la imagen original teniendo en cuenta el estilo, las sombras, reflejos y texturas. Puede incluso, cambiar el significado de la imagen. Pero las limitaciones en el uso de Dall-E llevan al sesgo Además de limitar su disponibilidad —la herramienta es accesible para un grupo reducido de público, principalmente investigadores de IA y algunos artistas sin fines comerciales— OpenIA ha implementado algunas restricciones en el uso de su nuevo modelo de inteligencia artificial. Estas restricciones intentan evitar un uso dañino u ofensivo de la herramienta impidiendo que genere imágenes violentas, sexuales o de contenido político. De igual modo impide generar imágenes que incluyan a personas conocidas o reconocibles. Evitar el sesgo y los estereotipos es uno de los grandes retos a los que se enfrenta la inteligencia artificial Estas limitaciones pueden sin embargo fomentar sesgos en modelos de IA como Dall-E. Los investigadores de OpenIA admiten consecuencias no previstas al aplicar esos filtros. Descubrieron que eliminar el contenido sexual para evitar que Dall-E produzca imágenes para adultos provoca que, en general, Dall-E genere menos imágenes de mujeres. “Esto no es bueno —señalan desde la publicación Vox— porque supone invisibilizar a las mujeres.” Pero este no es un problema exclusivo de Dall-E: evitar el sesgo y la persistencia de estereotipos suponen hoy uno de los grandes retos “para toda la comunidad de desarrolladores de IA.” La tecnología al servicio del planetaLa Inteligencia Artificial en las películas de ciencia ficción: un patrón recurrente de fascinación y terror
Nacho Palou 5G: cuatro casos de uso reales y prácticos El último informe “La Sociedad Digital en España 2022” [1] de Fundación Telefónica confirma la consolidación de los procesos de digitalización en la sociedad española. En este sentido, cabe...
Nacho Palou Cursos gratuitos online para aprender IoT (Internet de las Cosas) en 2023 Internet de las Cosas (IoT) es una de las tecnologías digitales de nueva generación con un impacto significativo en múltiples sectores, desde la industria a la agricultura, pasando por...
Fran Ramírez Mujeres que cambiaron las Matemáticas Por Fran Ramírez y Fran Fenoll Aprovechando que en marzo también se celebra el día Internacional de las Matemáticas, hemos querido rendir con esta recopilación un pequeño homenaje a mujeres que...
Nacho Palou #MujeresHacker de Telefónica Tech: Jess Woods, experta en Cloud Con motivo del Día de la Mujer, iniciamos una serie de entrevistas protagonizadas por #MujeresHacker de Telefónica Tech. Mujeres que, con su trabajo y esfuerzo, nos convierten en una...
Sergio Piorno Güemes Un nuevo paradigma financiero: la tokenización de activos En los últimos años se ha acelerado la digitalización del ecosistema financiero gracias a la adopción generalizada de internet y su consecuente desarrollo. Esto, junto con el auge de los dispositivos móviles,...
Nacho Palou MWC: Todas las innovaciones y el conocimiento experto que hemos compartido Después de cuatro intensos días, Mobile Word Congress (MWC) 2023 se despide hoy hasta el año que viene. Desde el pasado lunes, los asistentes han tenido ocasión de ver...