Paloma Recuero de los Santos Video Post #9: Analíticas Big Data, sí, pero ¿Cuáles? Sabemos que las analíticas avanzadas Big Data son imprescindibles para no perder la comba de la innovación digital. Lo que no tenemos tan claro es qué tipo de...
LUCA Talk: La importancia de la seguridad y aspectos legales en el gobierno de los datos. FORMATO: Charla de 30 minutos + Q&A de 10 minutosCUÁNDO: 3 de marzo, 16:00 h (CET)CÓMO: Inscripción gratuita en eventbrite SOBRE QUÉ: Desde la Comisión Europea se está definiendo y escribiendo...
Ismael Rihawi Data Engineer: poniendo orden en el caos de los datos Vivimos en una sociedad digital e hiperconectada, volcada en las redes sociales, acostumbrada a convivir entre sensores inteligentes y una nueva realidad con múltiples facetas (virtual, ampliada, mixta). En...
LUCA Semana Sports Analytics de LUCA en Movistar Centre Barcelona La semana pasada se celebró el Mobile World Congress en Barcelona y, aprovechando ese momento, el Movistar Centre acogió una acción dinamizadora organizada por LUCA, en colaboración con los...
LUCA Planificando la ubicación de un site de retail con los datos Una de las decisiones de negocio clave para cualquier marca es decidir dónde “establecer su tienda”. Esto implica la necesidad de conocer muy bien a los consumidores y su...
Alicia Martín Domingos El futuro de la telelectura de contadores de agua más allá del COVID19. A estas alturas del año y después de que la tercera ola del COVID19 esté en boca de todos, ya no es ninguna sorpresa decir que la pandemia ha...
LUCA LUCA y Sierra Nevada utilizan el Big Data para mejorar la experiencia de los esquiadores Con motivo de la celebración de los Campeonatos del mundo de FreestyleSki y Snowboard en Sierra Nevada (del 8 al 19 de marzo), se ha lanzado una nueva solución...
LUCA LUCA Fleet, ¿qué datos se esconden tras los vehículos de una flota? Contenido creado por Raquel Crespo Crisenti, Pedro A. Baigorri, María Luisa Rivero y Marta García Moreno, miembros del equipo de producto de LUCA. Son muchos los datos que se generan cada...
LUCA Domina los videojuegos clásicos con OpenAI y Machine Learning Para muchos de nosotros, pensar en videojuegos es recordar la infancia. Nos acordamos de todas esas horas que pasamos intentando pasar al siguiente nivel, y hasta podemos escuchar la...
LUCA LUCA Talk: Algoritmo de canciones: ¿Cómo crear el próximo hit musical con IA? Consideramos la música como una propiedad innata del ser humano, como uno de los triunfos de su ser. Pero ¿podemos reproducir la creatividad de los artistas a través de...
Paloma Recuero de los Santos Video Post #9: Analíticas Big Data, sí, pero ¿Cuáles? Sabemos que las analíticas avanzadas Big Data son imprescindibles para no perder la comba de la innovación digital. Lo que no tenemos tan claro es qué tipo de...
LUCA Talk: La importancia de la seguridad y aspectos legales en el gobierno de los datos. FORMATO: Charla de 30 minutos + Q&A de 10 minutosCUÁNDO: 3 de marzo, 16:00 h (CET)CÓMO: Inscripción gratuita en eventbrite SOBRE QUÉ: Desde la Comisión Europea se está definiendo y escribiendo...
Sesgos cognitivos en los datos (II): ConfirmaciónPaloma Recuero de los Santos 22 julio, 2020 Si recordamos, en el primer post de esta serie, ya introdujimos el concepto de sesgo cognitivo como patrón de desviación de nuestro juicio que se produce en determinadas situaciones y que conduce a la distorsión de la percepción, a un juicio inexacto o a una interpretación ilógica. En otras palabras, un “atajo mental“. Y explicamos en qué consiste el sesgo de supervivencia y cómo puede afectar al científico de datos. En esta segunda entrega, continuaremos con otro sesgo muy frecuente: el sesgo de confirmación. El sesgo de confirmación ¿Cuántas veces te has dicho a ti mismo: “Siempre que lavo el coche, llueve”? Cuando llueve justo después de que hayas lavado tu coche, recuerdas otras ocasiones en la que pasó lo mismo. De lo que no te acuerdas es de las veces que también lo lavaste y no llovió, porque tu cerebro, directamente, decide no registrar esa información. En ese caso, nuevamente has sido víctima de un sesgo cognitivo: el sesgo de confirmación. El sesgo de confirmación se produce cuando, de forma inconsciente, buscamos y damos preferencia a la información o a las pruebas que confirmen nuestras hipótesis o creencias, mientras ignoramos o menospreciamos los resultados adversos o atenuantes. Se trata, por tanto, de un sesgo cognitivo que representa un error de inferencia inductiva hacia la confirmación de la hipótesis en estudio. El sesgo de confirmación está estrechamente relacionado con otro sesgo conocido como “falacia de evidencia incompleta” o cherry picking. Aunque, en muchos casos su significado es muy similar, el cherry picking tiene un carácter deliberado, se selecciona la información que nos interesa, ignorando conscientemente la que no. El sesgo de confirmación, por su parte, está más relacionado con nuestras motivaciones y creencias. Los científicos de los datos exhiben sesgo de confirmación en la recogida de pruebas, cuando buscan activamente y le dan mayor relevancia a aquéllas que confirman su hipótesis, al tiempo que ignoran o subestiman las que podrían rebatirla. Pero estos sesgos no se limitan a la recogida de pruebas: también puede darse en su interpretación. Por ejemplo, cuando se interpretan evidencias ambiguas como confirmatorias. Un poco de historia El término «sesgo de confirmación» fue acuñado por el psicólogo inglés Peter Cathcart Wason en los años 60. Realizó un experimento en el que retaba a los participantes a tratar de demostrar una hipótesis falsa, para comprobar que la mayoría de las personas, en lugar de intentar refutarla, tendió a buscar su confirmación. La tarea de selección de Watson Este sencillo experimento, es un problema de lógica muy sencillo, pero, sorprendentemente, muy poca gente acierta a la primera. El investigador, colocó 4 cartas sobre una mesa. Por una cara, mostraban un número. Por la otra, un color. Y planteó una hipótesis: “Si la carta muestra un número par, entonces la cara opuesta es roja” Y una pregunta: ¿A qué dos cartas debería dar vuelta para comprobar la veracidad de esta hipótesis? Consideraba incorrectas las respuestas que identificaran una tarjeta que no necesita ser volteada, o que, por el contrario, no identificara una tarjeta que sí hubiera de serlo. Sólo el 10% de los sujetos del experimento dieron con la respuesta correcta. La única forma de invalidar esta hipótesis es encontrar una carta par que no sea roja. Si la carta 3 es roja (o marrón), no invalida la hipótesis, ya que ésta no hace afirmaciones sobre números impares.Si la tarjeta roja es impar (o par), tampoco la invalida porque el color rojo no es exclusivo de las cartas pares Pero tanto si la carta marrón es par, como si el 8 no es roja, se rebate la hipótesis. Por tanto, esta es la respuesta correcta. La explicación más coherente a estos resultados la aportó otro experimento, en este caso llevado a cabo por Evans y Lynch, en el que postularon la existencia de un “sesgo de emparejamiento” o matching bias. Los sujetos de experimento eligieron mayoritariamente las cartas que se mencionaban en el resultado (roja, par). En definitiva, este experimento demostró que, a la hora de demostrar si la hipótesis era correcta o no, la mayoría de las personas eligió la estrategia equivocada: tratar de confirmarla. Otros ejemplos No es complicado encontrar ejemplos de este sesgo, incluso en nuestra vida cotidiana. Porque no se trata sólo de buscar siempre los datos que nos den la razón y nos reafirmen en nuestras creencias u opiniones. Sino también en la forma en cómo interpretamos lo que nos ocurre. Como ocurría en el ejemplo del coche. En los últimos años, este sesgo se ha hecho mucho más evidente en las redes sociales, ya que ahora resulta mucho más fácil consumir la información únicamente desde aquella fuentes (páginas web, canales de youtube, blogs, redes…) que confirman nuestras creencias. De esta forma, damos crédito automáticamente a informaciones sin ningún tipo de comprobación previa. ¿Cómo evitarlo? Los científicos de datos, como cualquier otra persona, son susceptibles a sufrir este tipo de sesgo cognitivo. El problema es que, aferrarse a los datos que confirman tus hipótesis, y hacer caso omiso de las pruebas contradictorias, puede conducir a la toma de decisiones erróneas. Por tanto, es muy importante la creación de procesos de control que ayuden a evitar este tipo de sesgo. Tener una mente abierta, usar el método científico para intentar sopesar todas las pruebas, aportar transparencia en todo el proceso (datos, métodos, errores). Aunque nos incomode, porque las “certezas” nos dan sensación de seguridad, hemos de salir de nuestra zona de confort. Hacer, de vez en cuando, el saludable ejercicio de poner en duda nuestras creencias y poner en práctica una de las premisas básicas del método científico: Tratar de probar que lo que crees es falso. Para esta labor, puede sernos muy útil leer la regla número 8, sobre la calidad de los datos y las evidencias del Codigo de Conducta del Científico de Datos publicado por la Data Science Association. Post de la serie “Sesgos cognitivos en los datos”: Sesgos cognitivos en los datos (I): El sesgo de supervivenciaSesgos cognitivos en los datos (II): ConfirmaciónSesgos cognitivos en los datos (III): Coste hundidoSesgos cognitivos en los datos (IV): Disponibilidad Para mantenerte al día con LUCA visita nuestra página web, suscríbete a LUCA Data Speaks o síguenos en Twitter, LinkedIn y YouTube. Hacia una agricultura de datosEspinilleras Conectadas para mejorar el rendimiento deportivo y salud de los jugadores del Club Atlético Osasuna
Paloma Recuero de los Santos Video Post #9: Analíticas Big Data, sí, pero ¿Cuáles? Sabemos que las analíticas avanzadas Big Data son imprescindibles para no perder la comba de la innovación digital. Lo que no tenemos tan claro es qué tipo de...
Fran Ramírez Las matemáticas del Machine Learning: Números aleatorios y dónde encontrarlos (II) En el artículo anterior mencionamos la importancia que tienen en nuestro día a día los números aleatorios, utilizados para realizar cualquier tipo de simulación y fundamentales a la hora...
LUCA Talk: La importancia de la seguridad y aspectos legales en el gobierno de los datos. FORMATO: Charla de 30 minutos + Q&A de 10 minutosCUÁNDO: 3 de marzo, 16:00 h (CET)CÓMO: Inscripción gratuita en eventbrite SOBRE QUÉ: Desde la Comisión Europea se está definiendo y escribiendo...
LUCA La teoría Gestalt en Gobierno del Dato Al igual que un dato por si sólo no vale nada si no se le dota de información, conocimiento y se usa para un propósito, “Gobernar el dato por...
Paloma Recuero de los Santos Drones e IA para detectar síntomas de COVID19 La Universidad de Australia de Sur, UniSA ha diseñado una tecnología pionera en el mundo que combina ingeniería, drones, cámaras e inteligencia artificial para monitorizar a distancia constantes vitales....
LUCA Planificando la ubicación de un site de retail con los datos Una de las decisiones de negocio clave para cualquier marca es decidir dónde “establecer su tienda”. Esto implica la necesidad de conocer muy bien a los consumidores y su...