Sesgos cognitivos en los datos (II): ConfirmaciónPaloma Recuero de los Santos 22 julio, 2020 Si recordamos, en el primer post de esta serie, ya introdujimos el concepto de sesgo cognitivo como patrón de desviación de nuestro juicio que se produce en determinadas situaciones y que conduce a la distorsión de la percepción, a un juicio inexacto o a una interpretación ilógica. En otras palabras, un «atajo mental«. Y explicamos en qué consiste el sesgo de supervivencia y cómo puede afectar al científico de datos. En esta segunda entrega, continuaremos con otro sesgo muy frecuente: el sesgo de confirmación. El sesgo de confirmación ¿Cuántas veces te has dicho a ti mismo: «Siempre que lavo el coche, llueve»? Cuando llueve justo después de que hayas lavado tu coche, recuerdas otras ocasiones en la que pasó lo mismo. De lo que no te acuerdas es de las veces que también lo lavaste y no llovió, porque tu cerebro, directamente, decide no registrar esa información. En ese caso, nuevamente has sido víctima de un sesgo cognitivo: el sesgo de confirmación. El sesgo de confirmación se produce cuando, de forma inconsciente, buscamos y damos preferencia a la información o a las pruebas que confirmen nuestras hipótesis o creencias, mientras ignoramos o menospreciamos los resultados adversos o atenuantes. Se trata, por tanto, de un sesgo cognitivo que representa un error de inferencia inductiva hacia la confirmación de la hipótesis en estudio. El sesgo de confirmación está estrechamente relacionado con otro sesgo conocido como «falacia de evidencia incompleta» o cherry picking. Aunque, en muchos casos su significado es muy similar, el cherry picking tiene un carácter deliberado, se selecciona la información que nos interesa, ignorando conscientemente la que no. El sesgo de confirmación, por su parte, está más relacionado con nuestras motivaciones y creencias. Los científicos de los datos exhiben sesgo de confirmación en la recogida de pruebas, cuando buscan activamente y le dan mayor relevancia a aquéllas que confirman su hipótesis, al tiempo que ignoran o subestiman las que podrían rebatirla. Pero estos sesgos no se limitan a la recogida de pruebas: también puede darse en su interpretación. Por ejemplo, cuando se interpretan evidencias ambiguas como confirmatorias. Un poco de historia El término «sesgo de confirmación» fue acuñado por el psicólogo inglés Peter Cathcart Wason en los años 60. Realizó un experimento en el que retaba a los participantes a tratar de demostrar una hipótesis falsa, para comprobar que la mayoría de las personas, en lugar de intentar refutarla, tendió a buscar su confirmación. La tarea de selección de Watson Este sencillo experimento, es un problema de lógica muy sencillo, pero, sorprendentemente, muy poca gente acierta a la primera. El investigador, colocó 4 cartas sobre una mesa. Por una cara, mostraban un número. Por la otra, un color. Y planteó una hipótesis: «Si la carta muestra un número par, entonces la cara opuesta es roja» Y una pregunta: ¿A qué dos cartas debería dar vuelta para comprobar la veracidad de esta hipótesis? Consideraba incorrectas las respuestas que identificaran una tarjeta que no necesita ser volteada, o que, por el contrario, no identificara una tarjeta que sí hubiera de serlo. Sólo el 10% de los sujetos del experimento dieron con la respuesta correcta. La única forma de invalidar esta hipótesis es encontrar una carta par que no sea roja. Si la carta 3 es roja (o marrón), no invalida la hipótesis, ya que ésta no hace afirmaciones sobre números impares.Si la tarjeta roja es impar (o par), tampoco la invalida porque el color rojo no es exclusivo de las cartas pares Pero tanto si la carta marrón es par, como si el 8 no es roja, se rebate la hipótesis. Por tanto, esta es la respuesta correcta. La explicación más coherente a estos resultados la aportó otro experimento, en este caso llevado a cabo por Evans y Lynch, en el que postularon la existencia de un «sesgo de emparejamiento» o matching bias. Los sujetos de experimento eligieron mayoritariamente las cartas que se mencionaban en el resultado (roja, par). En definitiva, este experimento demostró que, a la hora de demostrar si la hipótesis era correcta o no, la mayoría de las personas eligió la estrategia equivocada: tratar de confirmarla. Otros ejemplos No es complicado encontrar ejemplos de este sesgo, incluso en nuestra vida cotidiana. Porque no se trata sólo de buscar siempre los datos que nos den la razón y nos reafirmen en nuestras creencias u opiniones. Sino también en la forma en cómo interpretamos lo que nos ocurre. Como ocurría en el ejemplo del coche. En los últimos años, este sesgo se ha hecho mucho más evidente en las redes sociales, ya que ahora resulta mucho más fácil consumir la información únicamente desde aquella fuentes (páginas web, canales de youtube, blogs, redes…) que confirman nuestras creencias. De esta forma, damos crédito automáticamente a informaciones sin ningún tipo de comprobación previa. ¿Cómo evitarlo? Los científicos de datos, como cualquier otra persona, son susceptibles a sufrir este tipo de sesgo cognitivo. El problema es que, aferrarse a los datos que confirman tus hipótesis, y hacer caso omiso de las pruebas contradictorias, puede conducir a la toma de decisiones erróneas. Por tanto, es muy importante la creación de procesos de control que ayuden a evitar este tipo de sesgo. Tener una mente abierta, usar el método científico para intentar sopesar todas las pruebas, aportar transparencia en todo el proceso (datos, métodos, errores). Aunque nos incomode, porque las «certezas» nos dan sensación de seguridad, hemos de salir de nuestra zona de confort. Hacer, de vez en cuando, el saludable ejercicio de poner en duda nuestras creencias y poner en práctica una de las premisas básicas del método científico: Tratar de probar que lo que crees es falso. Para esta labor, puede sernos muy útil leer la regla número 8, sobre la calidad de los datos y las evidencias del Codigo de Conducta del Científico de Datos publicado por la Data Science Association. Post de la serie «Sesgos cognitivos en los datos»: Sesgos cognitivos en los datos (I): El sesgo de supervivenciaSesgos cognitivos en los datos (II): ConfirmaciónSesgos cognitivos en los datos (III): Coste hundidoSesgos cognitivos en los datos (IV): Disponibilidad Para mantenerte al día con LUCA visita nuestra página web, suscríbete a LUCA Data Speaks o síguenos en Twitter, LinkedIn y YouTube. Hacia una agricultura de datosEspinilleras Conectadas para mejorar el rendimiento deportivo y salud de los jugadores del Club Atlético Osasuna
AI of Things Digital twin: ¿qué es y para qué sirve? Una de las claves del éxito empresarial es tener la capacidad de anticipar el impacto que eventuales cambios pueden tener en un producto o servicio. Eso es, básicamente, lo...
Alberto García García-Castro Incentivos en redes blockchain empresariales: un nuevo enfoque La importancia del uso de incentivos que premien la colaboración y las buenas prácticas de los participantes en una red blockchain siempre ha sido parte fundamental de la tecnología....
Pablo Salinero Ruiz AI of Things (VIII): segmentación y analítica para mejorar la experiencia de compra El auge del comercio electrónico, con las numerosas ventajas y comodidades que ofrece a los clientes, ha hecho que las tiendas físicas hayan visto reducida de forma significativa su...
Marta Mallavibarrena Inteligencia artificial: haciendo más reales las fake news Cómo usar la inteligencia artificial para crear una noticia totalmente falsa desde cero con el mínimo esfuerzo humano posible
Telefónica Tech ¿Es hora de empezar a plantar semillas digitales para el futuro? Preparar las operaciones empresariales para el futuro del trabajo es uno de los problemas que definen nuestra época. Las organizaciones de todo el mundo se encuentran ahora en una...
Álvaro Alegria Meunier Principales retos para la adopción del metaverso En un post anterior dedicado al metaverso explicaba en qué consiste el metaverso y veíamos qué oportunidades iba a ofrecer a las empresas. Hoy quiero compartir otros retos que, en...