Nacho Palou El poder de la digitalización sostenible en la lucha contra el cambio climático El cambio climático es considerado el mayor desafío de nuestro tiempo. Sus efectos abarcan desde la desertización y sequías hasta inundaciones y aumento del nivel del mar. Algunas de...
Carmen Urbano Digitalización del negocio internacional Las personas somos analógicas, la naturaleza es analógica y, en cambio, nuestra vida y nuestro trabajo cada vez son más digitales, más llenos de ceros y de unos, más...
AI of Things Semana Sports Analytics de LUCA en Movistar Centre Barcelona La semana pasada se celebró el Mobile World Congress en Barcelona y, aprovechando ese momento, el Movistar Centre acogió una acción dinamizadora organizada por LUCA, en colaboración con los...
Juan Luis Manfredi Liderazgo: qué podemos aprender de Toni Nadal, Phil Jackson y Vicente del Bosque Me interesa la figura del entrenador de élite, aquella persona que tiene que lidiar con los talentos en un ambiente muy competitivo y que está en el punto de mira...
ElevenPaths Noticias de Ciberseguridad: Boletín semanal 25-31 de julio BootHole: vulnerabilidad en GRUB2 Investigadores de Eclypsium han descubierto una vulnerabilidad de desbordamiento de búfer en el gestor de arranque GRUB2 que podría utilizarse para ejecutar código arbitrario durante el...
Área de Innovación y Laboratorio de Telefónica Tech Descubriendo APTualizador: el APT que parchea Windows A finales de junio de 2019 asistimos a un incidente en el que los equipos comienzan a reiniciarse prácticamente a la vez y sin causa aparente. En paralelo, detecta la...
Innovation Marketing Team 4YFN: Tecnología que adelanta al futuro La octava edición de 4 Years From Now (4YFN), el evento de emprendimiento que se celebra de manera paralela al Mobile World Congress (MWC), ha vuelto a brillar después de...
Telefónica Ecuador La biomédica y el big data: estudios más novedosos que cambiarán la salud mundial El desarrollo de nuevas tecnologías aplicadas al sector salud ha convertido a la ingeniería biomédica en una solución integral poco invasiva. Por eso, se trata de dar respuestas más rápidas en...
¿Qué son los modelos de difusión en Inteligencia Artificial?Jorge A. Hernández 9 junio, 2023 En días en los que la Inteligencia Artificial Generativa está tan de moda, es necesario conocer a uno de los grandes protagonistas de esta revolución del contenido automático: los modelos de difusión. Si alguna vez se ha preguntado de dónde viene el nombre de la plataforma generadora de imágenes a partir de texto, Stable Diffusion, le tenemos la respuesta: viene de los modelos de difusión. Más exactamente, del conocido como Latent Diffusion Model. Y no es la única plataforma que usa esta tecnología. También la utilizan DALL-E, Midjourney o Imagen. Es el siguiente gran paso tras las redes neuronales adversas (GAN). Pero primero, recordemos en qué consiste un modelo de difusión. En física, se trata de un proceso irreversible que consiste en el desplazamiento de las moléculas de una sustancia de una zona de mayor concentración a otra. Imaginen, por ejemplo, tener un vaso de agua donde se arroja una gota de tinta. Esta gota se irá diluyendo en el agua, mezclándose, y a medida que se arrojen más gotas, estas irán tiñendo totalmente el vaso. Los modelos de difusión buscan precisamente que, a partir de ese vaso de agua totalmente mezclado, volvamos al punto original cuando la primera gota estaba sin diluir. ¿Suena imposible? Tal vez en el mundo real, pero no en el terreno digital. ¿Cómo funciona en plataformas de Inteligencia Artificial? Cuando trasladamos el concepto de modelos de difusión al terreno informático, suena simple: se basa en añadir ruido a una imagen hasta difuminarla completamente y luego ser capaces de revertir este proceso. Es decir, partir de un bosquejo lleno de ruido hasta llegar a una imagen reconocible. Para hacerlo, se utilizan dos partes: la difusión directa y la difusión inversa. En la primera, se añaden, paso a paso, elementos que van distorsionando los datos (en este caso, una imagen), mientras que en la segunda se parte precisamente de unos datos distorsionados, utilizando una red neuronal entrenada, hasta llegar a una serie de imágenes. Imagen tomada: https://miro.medium.com/v2/resize:fit:1400/1*xc2Y6jwIUhfEGxJLytU1RA.png Para entrenar a esta red neuronal, se le entrega un gran conjunto de imágenes a las cuales se les irá añadiendo distorsiones aleatorias (ruido gaussiano, para ser más exactos), hasta que la máquina aprenda cómo difuminarlas por sí misma. Esto creará una red potente, pero con algunas limitaciones prácticas, como la lentitud en el procesamiento. Para solucionar este inconveniente, se usa una variación de los modelos de difusión llamada Latent Diffusion Model (LDM). Esta variante, en esencia, segmenta las imágenes volviéndolas más pequeñas al momento de procesarlas, y luego las devuelve a un tamaño mayor al entregar los resultados. Ahora, la pregunta es: ¿cómo se interactúa con estas plataformas de difusión de imágenes a través de texto? La respuesta viene dada en una sigla: CLIP, o Contrastive Language-Image Pre-Training. CLIP también es una red neuronal entrenada mediante pares (imagen, texto) desarrollada en 2021 por Open AI, la misma creadora de ChatGPT. Por supuesto, CLIP no es la única plataforma de su tipo, pero es la más conocida y potente tras ser entrenada usando más de 400 millones de imágenes. Por último, es bueno recordar que los modelos de difusión no solo sirven para crear imágenes, también para eliminar el ruido, mejorar la resolución, generar vídeos de alta calidad, incluso tiene aplicaciones en medicina y mercadeo, pero esa, es otra historia. Si quieres saber cómo desde Movistar Empresas te podemos ayudar a impulsar la transformación de tu negocio ingresa aquí. Foto de sketchepedia
Jorge A. Hernández Ciberseguridad en elecciones, un desafío para todos 2026 será un año agitado en materia electoral en América Latina, una situación que nos lleva a evaluar la tecnología en juego para salvaguardar estos procesos.
Jorge A. Hernández La revolución del embedded finance en las empresas El crédito embebido o embedded finance viene a diluir aún más esa frontera entre la banca y otros sectores.
Jorge A. Hernández AgroTech en el 2026: trazabilidad, analítica e IA La agroindustria atraviesa una transformación estructural en la que la tecnología deja de ser un complemento para convertirse en el motor de la seguridad alimentaria.
Jorge A. Hernández Las copias de seguridad y la resiliencia no son lo mismo Las copias de respaldo ya no son suficientes para garantizar la continuidad de procesos de negocios, ¿cómo transitar ese camino en las organizaciones?
Jorge A. Hernández IoT 2026 en entornos empresariales: ¿hacia dónde nos dirigimos? El IoT realiza hoy labores que van desde la seguridad hasta la continuidad de las operaciones. Conozca su estado en el 2026.
Jorge A. Hernández El valor del 5G en el 2026, el motor tras la revolución de las empresas La tecnología 5G promete empoderar a la próxima generación de industrias inteligentes y de servicios. ¿Pero en qué estado se encuentra?