Sesgos cognitivos en los datos (IV): Disponibilidad

Paloma Recuero de los Santos    10 noviembre, 2020

Terminamos nuestra serie sobre sesgos cognitivos en los datos con un sesgo bien conocido por todos, el sesgo de disponibilidad.

El sesgo de Disponibilidad

¿Te has planteado alguna vez cuál es el animal más peligroso para el ser humano? Seguramente tu mente no va a repasar uno a uno todos los animales que conozcas y su posible peligrosidad, sino que “tomará un atajo”. Sutilmente, cambiarás la pregunta.

Ya no será ¿Qué animales peligrosos existen?, sino ¿Qué animales peligrosos recuerdo/conozco? Entonces, vendrán a tu cabeza películas como “Tiburón”, “Piraña”, “Anaconda”; la noticia que leíste sobre unos montañeros atacados por un oso pardo, o el documental que viste sobre los cocodrilos marinos australianos.

Este sutil cambio en la pregunta, nos conduce a una respuesta sesgada y, muchas veces errónea. Como lo son las respuestas más comunes, las primeras que nos vienen a la cabeza: tiburón, cocodrilo, serpiente, araña etc. Los animales más letales del mundo son… los mosquitos. (Sí, incluso las muertes por “selfies temerarios” ya superan las producidas por un ataque de tiburón).

Figura1: Los animales más letales para el hombre (fuente)
Figura1: Los animales más letales para el hombre (fuente)

Nuevamente hemos sido víctimas de un sesgo cognitivo: el sesgo de disponibilidad.

El sesgo de disponibilidad consiste en basar nuestras decisiones en información que ya tenemos, o escuchamos a menudo sin buscar alternativas que puedan ser útiles.

En resumen, decidir basándonos en lo primero que nos viene a la cabeza. Como resultado, nos limitamos a un subconjunto muy específico de información, descartando otras fuentes de datos que potencialmente podrían mejorar nuestra respuesta.

Un poco más en detalle

Cuando estimamos la probabilidad de ocurrencia de determinados acontecimientos basándonos en la mayor o menor facilidad con que podemos construir ejemplos de ese acontecimiento, estamos empleando la heurística de disponibilidad.

Esta heurística generalmente está asociada a nuestra perspectiva y experiencia personal, por lo que claramente, está limitada por factores subjetivos. Por tanto nos conduce a un sesgo en la evaluación o interpretación de la probabilidad de ocurrencia de un evento.

Por ejemplo, si la primera vez que vamos a un restaurante no nos atienden bien, podemos pensar que es un establecimiento malo. Sin embargo, si siempre nos han atendido bien, y un día recibimos un mal servicio, no pensaremos lo mismo.

Otros ejemplos

Encontramos otro ejemplo muy claro en la publicidad. De hecho, el sesgo de disponibilidad es uno de los principales motivos por los que la publicidad funciona. Al tomar una decisión de compra en el día a día, no nos preguntamos ¿Cuál es el mejor producto/servicio para mí?, sino ¿Cuál es el mejor producto/servicio que conozco? Los consumidores cada vez disponemos de menos tiempo para este proceso de búsqueda y análisis, por lo que muchas veces nos descantamos por la “marca conocida”.

Otro ejemplo. ¿Por qué compramos lotería, cuando en el fondo sabemos que es casi imposible que nos toque? Muy sencillo, porque recordamos las imágenes en prensa, televisión y redes de los felices (y escasos) ganadores, pero no tenemos en consideración la inmensa mayoría de personas que juegan, y no ganan.

En este vídeo de de CogSai podemos encontrar más ejemplos de este sesgo explicados de forma sencilla.

¿Cómo evitarlo?

En Ciencia de Datos, el sesgo de disponibilidad surge cuando los científicos de datos crean modelos basándose únicamente en los datos más recientes, o en aquellos a los que pueden acceder con mayor facilidad. Al dar mayor relevancia a un conjunto limitado de datos, los resultados obtenidos tendrán también un alcance/efectividad limitados.

Para superar este sesgo es muy importante establecer altos estándares de pensamiento crítico: cuestionar con rigor, amplitud y profundidad las fuentes de información y los conjuntos de datos que usaremos para entrenar nuestros modelos.

Podemos resumirlo en dos reglas muy sencillas:

  • Buscar datos relevantes: tratar de encontrar múltiples fuentes acreditadas, considerar las estimaciones de incertidumbre, y explorar los datos nosotros mismos cuando estén disponibles.
  • Actúa como «abogado del diablo», no te conformes sólo con las pruebas que confirman tus creencias, probablemente te aporte información interesante buscar aquellas que las rebatirían.

En definitiva, pensamiento crítico, apertura de miras, y no basar nuestras decisiones/modelos en conjuntos de datos poco fiables, o limitados.


Post de la serie “Sesgos cognitivos en los datos”

Para mantenerte al día con LUCA visita nuestra página web suscríbete a LUCA Data Speaks o síguenos en TwitterLinkedIn YouTube.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *