Sesgos cognitivos en los datos (IV): DisponibilidadPaloma Recuero de los Santos 10 noviembre, 2020 Terminamos nuestra serie sobre sesgos cognitivos en los datos con un sesgo bien conocido por todos, el sesgo de disponibilidad. El sesgo de Disponibilidad ¿Te has planteado alguna vez cuál es el animal más peligroso para el ser humano? Seguramente tu mente no va a repasar uno a uno todos los animales que conozcas y su posible peligrosidad, sino que “tomará un atajo”. Sutilmente, cambiarás la pregunta. Ya no será ¿Qué animales peligrosos existen?, sino ¿Qué animales peligrosos recuerdo/conozco? Entonces, vendrán a tu cabeza películas como “Tiburón”, “Piraña”, “Anaconda”; la noticia que leíste sobre unos montañeros atacados por un oso pardo, o el documental que viste sobre los cocodrilos marinos australianos. Este sutil cambio en la pregunta, nos conduce a una respuesta sesgada y, muchas veces errónea. Como lo son las respuestas más comunes, las primeras que nos vienen a la cabeza: tiburón, cocodrilo, serpiente, araña etc. Los animales más letales del mundo son… los mosquitos. (Sí, incluso las muertes por “selfies temerarios” ya superan las producidas por un ataque de tiburón). Figura1: Los animales más letales para el hombre (fuente) Nuevamente hemos sido víctimas de un sesgo cognitivo: el sesgo de disponibilidad. El sesgo de disponibilidad consiste en basar nuestras decisiones en información que ya tenemos, o escuchamos a menudo sin buscar alternativas que puedan ser útiles. En resumen, decidir basándonos en lo primero que nos viene a la cabeza. Como resultado, nos limitamos a un subconjunto muy específico de información, descartando otras fuentes de datos que potencialmente podrían mejorar nuestra respuesta. Un poco más en detalle Cuando estimamos la probabilidad de ocurrencia de determinados acontecimientos basándonos en la mayor o menor facilidad con que podemos construir ejemplos de ese acontecimiento, estamos empleando la heurística de disponibilidad. Esta heurística generalmente está asociada a nuestra perspectiva y experiencia personal, por lo que claramente, está limitada por factores subjetivos. Por tanto nos conduce a un sesgo en la evaluación o interpretación de la probabilidad de ocurrencia de un evento. Por ejemplo, si la primera vez que vamos a un restaurante no nos atienden bien, podemos pensar que es un establecimiento malo. Sin embargo, si siempre nos han atendido bien, y un día recibimos un mal servicio, no pensaremos lo mismo. Otros ejemplos Encontramos otro ejemplo muy claro en la publicidad. De hecho, el sesgo de disponibilidad es uno de los principales motivos por los que la publicidad funciona. Al tomar una decisión de compra en el día a día, no nos preguntamos ¿Cuál es el mejor producto/servicio para mí?, sino ¿Cuál es el mejor producto/servicio que conozco? Los consumidores cada vez disponemos de menos tiempo para este proceso de búsqueda y análisis, por lo que muchas veces nos descantamos por la “marca conocida”. Otro ejemplo. ¿Por qué compramos lotería, cuando en el fondo sabemos que es casi imposible que nos toque? Muy sencillo, porque recordamos las imágenes en prensa, televisión y redes de los felices (y escasos) ganadores, pero no tenemos en consideración la inmensa mayoría de personas que juegan, y no ganan. En este vídeo de de CogSai podemos encontrar más ejemplos de este sesgo explicados de forma sencilla. ¿Cómo evitarlo? En Ciencia de Datos, el sesgo de disponibilidad surge cuando los científicos de datos crean modelos basándose únicamente en los datos más recientes, o en aquellos a los que pueden acceder con mayor facilidad. Al dar mayor relevancia a un conjunto limitado de datos, los resultados obtenidos tendrán también un alcance/efectividad limitados. Para superar este sesgo es muy importante establecer altos estándares de pensamiento crítico: cuestionar con rigor, amplitud y profundidad las fuentes de información y los conjuntos de datos que usaremos para entrenar nuestros modelos. Podemos resumirlo en dos reglas muy sencillas: Buscar datos relevantes: tratar de encontrar múltiples fuentes acreditadas, considerar las estimaciones de incertidumbre, y explorar los datos nosotros mismos cuando estén disponibles.Actúa como «abogado del diablo», no te conformes sólo con las pruebas que confirman tus creencias, probablemente te aporte información interesante buscar aquellas que las rebatirían. En definitiva, pensamiento crítico, apertura de miras, y no basar nuestras decisiones/modelos en conjuntos de datos poco fiables, o limitados. Post de la serie “Sesgos cognitivos en los datos” Sesgos cognitivos en los datos (I): El sesgo de supervivenciaSesgos cognitivos en los datos (II): ConfirmaciónSesgos cognitivos en los datos (III): Coste hundidoSesgos cognitivos en los datos (IV): Disponibilidad Para mantenerte al día con LUCA visita nuestra página web, suscríbete a LUCA Data Speaks o síguenos en Twitter, LinkedIn y YouTube. Reinventar la industria textil a partir de la informaciónSupervisa tu entrenamiento de redes neuronales con TensorBoard
Olivia Brookhouse ¿Puede la Inteligencia Artificial entender las emociones? Cuando John McCarthy y Marvin Minsky iniciaron la Inteligencia Artificial en 1956, se sorprendieron de cómo una máquina podía resolver rompecabezas increíblemente difíciles en menos tiempo que los humanos. Sin...
Javier Martínez Borreguero Automatización, Conectividad e Inteligencia Aumentada al servicio de una reindustrialización competitiva, disruptiva y sostenible Por segundo año consecutivo vuelvo a participar en el Advanced Factories (AF 2023), la mayor exposición y congreso profesional dedicado a la Industria 4.0 del sur de Europa. Un...
Nacho Palou Medidas para reducir la brecha digital de género sin esperar 32 años El informe Sociedad Digital en España 2023, de Fundación Telefónica, dedica un apartado específico para analizar la brecha de género en el ámbito del talento digital. Destaca que, si bien...
Nacho Palou Raspberry Pi para Edge AI: Inteligencia Artificial en el borde para todos Raspberry Pi es un popular ordenador muy utilizado entre desarrolladores, estudiantes y aficionados a la informática, a la robótica y a ‘cacharrear’. Entre sus virtudes están su bajo coste...
Carlos Lorenzo Ya no eres solo una empresa de productos o servicios, eres una empresa de datos Todas las empresas que operan en la actualidad son en realidad empresas de datos. Y lo son porque día a día almacenan y utilizan una gran cantidad de información:...
Jorge Rubio Álvarez Inteligencia Artificial aplicada a la Ciberseguridad industrial (OT) La Ciberseguridad en los entornos industriales u OT (Operational Technology) es crucial para proteger infraestructuras críticas como la energía, el transporte y la comunicación. Una preocupación cada vez mayor...