Sesgos cognitivos en los datos (II): Confirmación

Paloma Recuero de los Santos    22 julio, 2020

Si recordamos, en el primer post de esta serie, ya introdujimos el concepto de sesgo cognitivo como patrón de desviación de nuestro juicio que se produce en determinadas situaciones y que conduce a la distorsión de la percepción, a un juicio inexacto o a una interpretación ilógica. En otras palabras, un “atajo mental“. Y explicamos en qué consiste el sesgo de supervivencia y cómo puede afectar al científico de datos. En esta segunda entrega, continuaremos con otro sesgo muy frecuente: el sesgo de confirmación.

El sesgo de confirmación

¿Cuántas veces te has dicho a ti mismo: “Siempre que lavo el coche, llueve”? Cuando llueve justo después de que hayas lavado tu coche, recuerdas otras ocasiones en la que pasó lo mismo. De lo que no te acuerdas es de las veces que también lo lavaste y no llovió, porque tu cerebro, directamente, decide no registrar esa información. En ese caso, nuevamente has sido víctima de un sesgo cognitivo: el sesgo de confirmación.

El sesgo de confirmación se produce cuando, de forma inconsciente, buscamos y damos preferencia a la información o a las pruebas que confirmen nuestras hipótesis o creencias, mientras ignoramos o menospreciamos los resultados adversos o atenuantes.

Se trata, por tanto, de un sesgo cognitivo que representa un error de inferencia inductiva hacia la confirmación de la hipótesis en estudio.

El sesgo de confirmación está estrechamente relacionado con otro sesgo conocido como “falacia de evidencia incompleta” o cherry picking. Aunque, en muchos casos su significado es muy similar, el cherry picking tiene un carácter deliberado, se selecciona la información que nos interesa, ignorando conscientemente la que no. El sesgo de confirmación, por su parte, está más relacionado con nuestras motivaciones y creencias.

Los científicos de los datos exhiben sesgo de confirmación en la recogida de pruebas, cuando buscan activamente y le dan mayor relevancia a aquéllas que confirman su hipótesis, al tiempo que ignoran o subestiman las que podrían rebatirla.

Pero estos sesgos no se limitan a la recogida de pruebas: también puede darse en su interpretación. Por ejemplo, cuando se interpretan evidencias ambiguas como confirmatorias.

Un poco de historia

El término «sesgo de confirmación» fue acuñado por el psicólogo inglés Peter Cathcart Wason en los años 60. Realizó un experimento en el que retaba a los participantes a tratar de demostrar una hipótesis falsa, para comprobar que la mayoría de las personas, en lugar de intentar refutarla, tendió a buscar su confirmación.

La tarea de selección de Watson

Este sencillo experimento, es un problema de lógica muy sencillo, pero, sorprendentemente, muy poca gente acierta a la primera.

El investigador, colocó 4 cartas sobre una mesa. Por una cara, mostraban un número. Por la otra, un color. Y planteó una hipótesis:

Si la carta muestra un número par, entonces la cara opuesta es roja”

Y una pregunta:

¿A qué dos cartas debería dar vuelta para comprobar la veracidad de esta hipótesis?

Consideraba incorrectas las respuestas que identificaran una tarjeta que no necesita ser volteada, o que, por el contrario, no identificara una tarjeta que sí hubiera de serlo.

Sólo el 10% de los sujetos del experimento dieron con la respuesta correcta. La única forma de invalidar esta hipótesis es encontrar una carta par que no sea roja.

  • Si la carta 3 es roja (o marrón), no invalida la hipótesis, ya que ésta no hace afirmaciones sobre números impares.
  • Si la tarjeta roja es impar (o par), tampoco la invalida porque el color rojo no es exclusivo de las cartas pares

Pero tanto si la carta marrón es par, como si el 8 no es roja, se rebate la hipótesis. Por tanto, esta es la respuesta correcta.

La explicación más coherente a estos resultados la aportó otro experimento, en este caso llevado a cabo por Evans y Lynch, en el que postularon la existencia de un “sesgo de emparejamiento” o matching bias. Los sujetos de experimento eligieron mayoritariamente las cartas que se mencionaban en el resultado (roja, par).

En definitiva, este experimento demostró que, a la hora de demostrar si la hipótesis era correcta o no, la mayoría de las personas eligió la estrategia equivocada: tratar de confirmarla.

Otros ejemplos

No es complicado encontrar ejemplos de este sesgo, incluso en nuestra vida cotidiana. Porque no se trata sólo de buscar siempre los datos que nos den la razón y nos reafirmen en nuestras creencias u opiniones. Sino también en la forma en cómo interpretamos lo que nos ocurre. Como ocurría en el ejemplo del coche.

En los últimos años, este sesgo se ha hecho mucho más evidente en las redes sociales, ya que ahora resulta mucho más fácil consumir la información únicamente desde aquella fuentes (páginas web, canales de youtube, blogs, redes…) que confirman nuestras creencias. De esta forma, damos crédito automáticamente a informaciones sin ningún tipo de comprobación previa.

¿Cómo evitarlo?

Los científicos de datos, como cualquier otra persona, son susceptibles a sufrir este tipo de sesgo cognitivo. El problema es que, aferrarse a los datos que confirman tus hipótesis, y hacer caso omiso de las pruebas contradictorias, puede conducir a la toma de decisiones erróneas.

Por tanto, es muy importante la creación de procesos de control que ayuden a evitar este tipo de sesgo. Tener una mente abierta, usar el método científico para intentar sopesar todas las pruebas, aportar transparencia en todo el proceso (datos, métodos, errores).

Aunque nos incomode, porque las “certezas” nos dan sensación de seguridad, hemos de salir de nuestra zona de confort. Hacer, de vez en cuando, el saludable ejercicio de poner en duda nuestras creencias y poner en práctica una de las premisas básicas del método científico: Tratar de probar que lo que crees es falso.

Para esta labor, puede sernos muy útil leer la regla número 8, sobre la calidad de los datos y las evidencias del Codigo de Conducta del Científico de Datos publicado por la Data Science Association.

Para mantenerte al día con LUCA visita nuestra página web suscríbete a LUCA Data Speaks o síguenos en TwitterLinkedIn YouTube.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *