Inteligencia Artificial y las compras online: Sistemas de Recomendacion (2)Paloma Recuero de los Santos 14 agosto, 2018 En nuestro primer post sobre sistemas de recomendación: ¿Qué tiene que ver una careta de Darth Vader con la Nancy Comunión?: Sistemas de Recomendación (1), ya hablamos de lo que son los sistemas de recomendación o «recommenders», y de cómo, mientras algunos buscan similitudes entre los clientes, otros las buscan en los contenidos o en una mezcla de ambas cosas. También vimos cómo la elección del algoritmo en cada caso, se basa en la información que tengamos sobre nuestros clientes, nuestros productos, o de las opiniones de los primeros sobre los segundos que podamos recabar. En este post, hablaremos de las distintas estrategias seguidas por los sistemas de recomendación en los que se basan las estrategias de comercio online. Hoy vamos a hablar de los distintos tipos de sistemas de recomendación que podemos encontrar. En concreto, son 5 que, de los más sencillos a los más complejos son: Artículos más populares Modelos de asociación y análisis de afinidad Filtrado de contenido Filtrado colaborativo Modelos híbridos 1. Empecemos por la estrategia más simple: Artículos más populares. Consiste en ofrecer a los clientes aquellos los artículos “superventas”, los que sean: libros, películas, prendas de ropa… etc. No hay mucha ciencia de datos que valga. Tan sólo tomar los datos de los informes de ventas. Tampoco es que sea muy personalizado, pero cuando sabes poco de tus clientes, puede funcionar. Home Depot y GAP lo suelen usar con frases gancho como “Novedades”, o “Próximamente en tiendas”. Es importante que los productos ofrecidos, al menos, pertenezcan a la misma categoría que los que ha visto recientemente el cliente. Se puede usar en combinación con otras estrategias. Otro ejemplo de Amazon, para variar: Figura 1: Ejemplo de recomendación basada en los productos más vendidos de la categoría. 2. La segunda estrategia, modelos de asociación o análisis de afinidad. Esta estrategia se conoce popularmente por su nombre en inglés “market basket analysis”. Se basa casi exclusivamente en los productos adquiridos en cada transacción. Ambas técnicas se basa en análisis estadísticos que buscan qué elementos o servicios suelen ser adquiridos de forma conjunta. Cuando los clientes adquieren los productos o servicios de uno en uno, se llama asociación. En este caso, como es natural, el foco no puede estar en los productos, sino centramos en el histórico de compras del cliente. Los algoritmos matemáticos en que se basan estas técnicas crean parejas de productos que tienen una fuerte relación de afinidad y crean ofertas personalizadas para los clientes que han adquirido uno de estos productos, pero no el otro. Es una técnica fácil y rápida que funciona bien aun con bases de datos de clientes pequeñas o dispersas y suele ser la estrategia más rentable para hacer ofertas personalizadas. Son el clásico ejemplo de “Los clientes que compraron este producto también compraron este otro” o “Productos que se suelen comprar juntos”. Figura 2: Ejemplo de recomendación basada en productos que suelen adquirirse de forma conjunta. Como se utiliza muy poca información del cliente, resulta difícil acertar cuando el catálogo es muy amplio. Sin embargo, se puede filtrar basándose en el historial de navegación del cliente. Figura 3: Ejemplo de recomendación basada en productos que suelen adquirirse de forma conjunta.y el historial de navegación /compras del cliente. 3. Filtrado de contenido. El filtrado de contenido hizo furor hace 10 años, pero se sigue usando mucho en la actualidad. Consiste en buscar similitudes entre los artículos que un cliente ha consultado o adquirido en el pasado, para ofrecerle ofertas personalizadas basadas en sus preferencias. El histórico de compras de un cliente se traduce en una serie de atributos de los artículos que se expresan de forma conjunta por medio de un vector. Cada componente del vector tiene un coeficiente o peso que puede ser “aprendido” o “asignado” para darle mayor o menor valor a determinado atributo. Estos coeficientes o pesos se comparan con los correspondientes a distintos productos que pueden ser recomendados. Para hacer estos cálculos se pueden usar distintas técnicas: clasificadores Bayesianos, técnicas de clustering o segmentación, árboles de decisión o incluso redes neuronales artificiales. Para ello es necesario tener un número importante de características que se pueden usar en la clasificación. Algunos pueden ser fáciles de adquirir, pero otros, no tanto. Por ejemplo, cuando los inventarios cambian con mucha rapidez, o son demasiado grandes (como en ventas de música, películas etc) puede ser muy difícil o costoso. Aun así, webs de recomendación de películas como Rotten Tomatoes, se basan en esta estrategia. Sin embargo, si el clasificador no tiene más información que el valor binario: comprado/no comprado, la recomendación que pueda hacernos no será muy fiable. ¿Cómo resolver este problema? Según el entorno, se pueden usar algunas de estas estrategias. Por ejemplo, pedirle al usuario: Que nos indique si la recomendación le ha interesado o no Que nos indique su nivel de satisfacción con el artículo adquirido Que nos informe sobre sus preferencias, para poder ofrecerle recomendaciones más ajustadas a su perfil Que nos facilite información demográfica o de segmentación que ayude a mejorar el perfil de usuario. Con este fin, en Rotten Tomatoes crearon el “Tomatómetro” con el que asignan un score o “nota” a las películas, basado en opiniones de críticos profesionales, y de los propios usuarios. Figura 4: Tomatómetro basado en opiniones de usuarios y críticos profesionales. 4. El filtrado colaborativo. En este caso el foco está en el usuario y en aquellos otros que el algoritmo considera “similares”. En principio no es preciso definir atributos específicos que puedan ser inferidos por el algoritmo, pero si los tenemos, funcionará mucho mejor. La premisa de partida es: Si dos clientes muestran una gran similitud en sus “Me gusta” o “No me gusta” pasados, asumimos que mantendrán esa tendencia en el futuro. Figura 5: Like o «Me gusta». Por ejemplo, el algoritmo asociará personas a las que les gustan las películas de terror con películas que tengan contenidos “terroríficos”, sin necesidad de definir el género “terror”. Así, a estas personas, les recomendará productos basados en esta asociación. Películas de terror, libros de Stephen King, camisetas de “Pesadilla en Elm Street”…, muñecos Chuky… Para que funcione esta técnica, necesitamos una calificación post-selección, un indicador de me gusta/no me gusta y/o un perfilado previo del usuario. Con esta información, intentará predecir qué “nota” le daría el usuario a un producto que no ha visto con anterioridad. La precisión de la predicción se puede medir después comparándola con la calificación que haya dado el usuario una vez adquirido el producto. Los sistemas de filtrado colaborativo se basan en vectores de características. Los más sencillos, se basan en las características del usuario (productos por los que ha mostrado interés, volumen, frecuencia o tipo de compras previas etc). Los sistemas más complejos añaden vectores de características de los productos (autor, género, duración etc). Los algoritmos calculan similitudes entre estos vectores para así identificar productos o clientes “similares”. De esta forma, las recomendaciones se basan en lo que han elegido clientes “similares”, o en productos “similares” a otros que ha adquirido o captado el interés de ese cliente. ¿Y en qué tipos de datos se basan los sistemas de filtrado colaborativo? Por un lado, en atributos del usuario como: El nivel de satisfacción con el producto (1 a 5), o si ha marcado «Me gusta/No me gusta» Observar qué términos de búsqueda ha utilizado para localizar determinado producto Crear un perfil «Me gusta/No me gusta» por género, autor u otros factores Ofrecer dos alternativas y preguntar al usuario cuál prefiere También se pueden analizar datos relativos a su comportamiento online como: ¿Qué artículos ha estado mirando el usuario y cuánto tiempo? ¿Qué artículos ha comprado? Si tenemos su permiso para analizarlas, ¿Qué listas de reproducción ha escuchado o visto el usuario? ¿Qué «Me gusta/No me gusta» de este usuario se pueden encontrar en otras fuentes externas (redes sociales)? Los sistemas de filtrado colaborativo necesitan analizar grandes volúmenes de datos. Como las recomendaciones se basan en valoraciones previas (rating), no pueden recomendar productos nuevos. Suelen recomendar productos populares, por tanto, no suelen funcionar bien con clientes con gustos más exclusivos. 5. Los sistemas híbridos. Hay dos enfoques posibles: Los sistemas basados en conocimiento o “fuerza bruta”, en los que los Jefes de producto directamente definen qué productos deben ofrecerse juntos o como complemento unos de otros. Los sistemas basados en filtrado de contenido o filtrado colaborativo, como hace Netflix, que ofrece recomendaciones basadas en los hábitos de compra de usuarios similares (filtrado colaborativo), o en artículos con valoraciones de los usuarios muy altas y atributos similares de contenido (filtrado de contenido) La elección del sistema de recomendación más adecuado también dependerá del momento de la experiencia de usuario en que se encuentra el cliente. ¿No ha encontrado lo que busca y quiero ofrecerle una alternativa? ¿ha adquirido un producto y quiero ofrecerle otros productos complementarios? ¿o quiero inspirarle para comprar algo totalmente diferente? ¿Has averiguado ya qué sistema de recomendación necesitas? La respuesta, probablemente, sea un sistema híbrido, en el que tendrás que decidir qué componentes incluir y cómo configurarlos, pero, como ves, merece la pena investigarlo. Esperamos que este post os haya ayudado a entender de qué forma los sistemas de recomendación te pueden ayudar a incrementar, y mucho, las ventas de tu comercio online.Y si eres más de «hilos», aquí te dejamos el enlace para leerlo en Twitter. Adivina adivinanza… ¿Sabes cómo utilizan las tiendas online la inteligencia artificial? En este hilo averiguarás cómo funcionan sistemas de recomendación capaces de aumentar hasta un 25% las ventas 🚀📈 👇 — LUCA (@LUCA_D3) June 15, 2018 https://platform.twitter.com/widgets.js’%20defer%20onload=» defer onload=’ No te pierdas ninguno de nuestros post. Suscríbete a LUCA Data Speaks. También puedes seguirnos en Twitter, YouTube y LinkedIn Resumen de verano de LUCA Data Speaks: 30 Julio al 10 Agosto¿Qué son las estrategias de «Dynamic Pricing»?
Telefónica Tech Lo que necesita la Inteligencia Artificial para generar confianza (podcast) El el episodio 10 de nuestro podcast Latencia Cero, “ConfIA en la IA”, tuvimos la oportunidad de contar con la participación de Lucía Ortiz de Zárate, investigadora en Ética...
Nacho Palou 5G: cuatro casos de uso reales y prácticos El último informe “La Sociedad Digital en España 2022” [1] de Fundación Telefónica confirma la consolidación de los procesos de digitalización en la sociedad española. En este sentido, cabe...
Nacho Palou Cursos gratuitos online para aprender IoT (Internet de las Cosas) en 2023 Internet de las Cosas (IoT) es una de las tecnologías digitales de nueva generación con un impacto significativo en múltiples sectores, desde la industria a la agricultura, pasando por...
Fran Ramírez Mujeres que cambiaron las Matemáticas Por Fran Ramírez y Fran Fenoll Aprovechando que en marzo también se celebra el día Internacional de las Matemáticas, hemos querido rendir con esta recopilación un pequeño homenaje a mujeres que...
Nacho Palou #MujeresHacker de Telefónica Tech: Jess Woods, experta en Cloud Con motivo del Día de la Mujer, iniciamos una serie de entrevistas protagonizadas por #MujeresHacker de Telefónica Tech. Mujeres que, con su trabajo y esfuerzo, nos convierten en una...
Sergio Piorno Güemes Un nuevo paradigma financiero: la tokenización de activos En los últimos años se ha acelerado la digitalización del ecosistema financiero gracias a la adopción generalizada de internet y su consecuente desarrollo. Esto, junto con el auge de los dispositivos móviles,...