Pablo Blasco Tu nuevo coche será un software De nueve a multitud. Esta es la transformación que sufrirá la industria de la automoción en los próximos años. Nueve son las compañías que ostentan gran parte de la...
Telefónica Ecuador Reinventar la industria textil a partir de la información La industrial textil ecuatoriana es el segundo empleador del país. Y representa más de la quinta parte de la producción manufacturera del país. A partir de estas cifras, es necesario fundamentar la toma...
José Ramón Suárez Rivas La necesidad de una cultura del reconocimiento en las organizaciones Muy a menudo me pregunto la importancia que tiene en nuestro trabajo una cultura del reconocimiento, que valoren nuestros logros. ¿Y esto de qué depende?: ¿de la cultura de...
Ana García-Valenzuela La relación hombre-máquina: lo que aprendimos de Mazinger Z Cuatro décadas han pasado ya desde que la serie de animación “Mazinger Z” y su famoso “¡puños fuera!” se estrenara en TVE. El mítico robot marcó a varias generaciones...
Ernesto Muñoz Evolución de la Ciberseguridad: la IA como herramienta de ataque y defensa La Inteligencia Artificial (IA) es una poderosa herramienta donde las organizaciones y sus diferentes equipos pueden apoyarse para automatizar tareas en el campo de la Ciberseguridad.
Javier Provecho Descubierta una vulnerabilidad en Kubernetes que permite acceso a redes restringidas (CVE-2020-8562) Kubernetes es un sistema de código abierto para automatizar las operaciones de contenedores, utilizado por multitud de empresas en servicios de primer nivel. Hoy en día, se ha convertido...
Andrés Macario Tecnología y datos, el binomio perfecto para digitalizarse Las revoluciones comienzan con una serie de señales de que algo está ocurriendo y que, en un principio, parecen inconexas. Lo cierto es que durante la era de la...
María Baranguán Una nueva forma de aprendizaje desde la gran pantalla del salón ¿Has oído hablar del concepto de edutainment? Como bien indica la palabra en sí misma, el edutainment es la combinación de los términos en inglés education y entertainment. Es...
¿Qué son los modelos de difusión en Inteligencia Artificial?Jorge A. Hernández 9 junio, 2023 En días en los que la Inteligencia Artificial Generativa está tan de moda, es necesario conocer a uno de los grandes protagonistas de esta revolución del contenido automático: los modelos de difusión. Si alguna vez se ha preguntado de dónde viene el nombre de la plataforma generadora de imágenes a partir de texto, Stable Diffusion, le tenemos la respuesta: viene de los modelos de difusión. Más exactamente, del conocido como Latent Diffusion Model. Y no es la única plataforma que usa esta tecnología. También la utilizan DALL-E, Midjourney o Imagen. Es el siguiente gran paso tras las redes neuronales adversas (GAN). Pero primero, recordemos en qué consiste un modelo de difusión. En física, se trata de un proceso irreversible que consiste en el desplazamiento de las moléculas de una sustancia de una zona de mayor concentración a otra. Imaginen, por ejemplo, tener un vaso de agua donde se arroja una gota de tinta. Esta gota se irá diluyendo en el agua, mezclándose, y a medida que se arrojen más gotas, estas irán tiñendo totalmente el vaso. Los modelos de difusión buscan precisamente que, a partir de ese vaso de agua totalmente mezclado, volvamos al punto original cuando la primera gota estaba sin diluir. ¿Suena imposible? Tal vez en el mundo real, pero no en el terreno digital. ¿Cómo funciona en plataformas de Inteligencia Artificial? Cuando trasladamos el concepto de modelos de difusión al terreno informático, suena simple: se basa en añadir ruido a una imagen hasta difuminarla completamente y luego ser capaces de revertir este proceso. Es decir, partir de un bosquejo lleno de ruido hasta llegar a una imagen reconocible. Para hacerlo, se utilizan dos partes: la difusión directa y la difusión inversa. En la primera, se añaden, paso a paso, elementos que van distorsionando los datos (en este caso, una imagen), mientras que en la segunda se parte precisamente de unos datos distorsionados, utilizando una red neuronal entrenada, hasta llegar a una serie de imágenes. Imagen tomada: https://miro.medium.com/v2/resize:fit:1400/1*xc2Y6jwIUhfEGxJLytU1RA.png Para entrenar a esta red neuronal, se le entrega un gran conjunto de imágenes a las cuales se les irá añadiendo distorsiones aleatorias (ruido gaussiano, para ser más exactos), hasta que la máquina aprenda cómo difuminarlas por sí misma. Esto creará una red potente, pero con algunas limitaciones prácticas, como la lentitud en el procesamiento. Para solucionar este inconveniente, se usa una variación de los modelos de difusión llamada Latent Diffusion Model (LDM). Esta variante, en esencia, segmenta las imágenes volviéndolas más pequeñas al momento de procesarlas, y luego las devuelve a un tamaño mayor al entregar los resultados. Ahora, la pregunta es: ¿cómo se interactúa con estas plataformas de difusión de imágenes a través de texto? La respuesta viene dada en una sigla: CLIP, o Contrastive Language-Image Pre-Training. CLIP también es una red neuronal entrenada mediante pares (imagen, texto) desarrollada en 2021 por Open AI, la misma creadora de ChatGPT. Por supuesto, CLIP no es la única plataforma de su tipo, pero es la más conocida y potente tras ser entrenada usando más de 400 millones de imágenes. Por último, es bueno recordar que los modelos de difusión no solo sirven para crear imágenes, también para eliminar el ruido, mejorar la resolución, generar vídeos de alta calidad, incluso tiene aplicaciones en medicina y mercadeo, pero esa, es otra historia. Si quieres saber cómo desde Movistar Empresas te podemos ayudar a impulsar la transformación de tu negocio ingresa aquí. Foto de sketchepedia
Jorge A. Hernández ¿Qué son los Chief Data Officer (CDO) y por qué son importantes? En 2022 los CDO o chief data officer ya estaban presentes en el 27 % de las grandes empresas del mundo. ¿En qué consiste su rol?
Jorge A. Hernández La importancia y los desafíos que enfrenta el sistema de cifrado RSA El futuro del sistema de encriptación RSA se ve amenazado por nuevas tecnologías. Conozca esta transición.
Jorge A. Hernández Computación cuántica como un servicio (QCaaS): ¿el futuro del cómputo? Aunque la computación cuántica se suele ver como un privilegio, por sus costos y dificultades logísticas, es una candidata para la nube.
Jorge A. Hernández Conozca los retos tecnológicos para el 2025 Más desempeño con menor costo, más Inteligencia Artificial sin afectar el manejo de los datos y más ciberseguridad sin influir en la experiencia del cliente: estos son solo algunos...
Jorge A. Hernández El consumidor del 2025: ¿cómo ha evolucionado? Con transformaciones en sus hábitos de compra, derivadas incluso desde antes de la pandemia, el consumidor del 2025 presenta cambios que van desde la forma misma de informarse hasta...
Jorge A. Hernández La importancia de la flexibilidad en la empresa moderna y cómo conseguirla ¿Qué tienen en común empresas como Kodak, Blockbuster, Nokia y Blackberry? La respuesta es obvia: no supieron adaptarse a los cambios y perdieron su liderazgo, lo que resalta la...