Sobre falacias y sesgos: o cómo hacer un mal uso de los datos

Hace unos días me llamó poderosamente la atención el post de Carlos Victor Costa publicado en linkedin “LOS DATOS NO SON TODO. LO IMPORTANTE ES SABER USARLOS” que reproduzco a continuación.

 

Durante la Segunda Guerra Mundial, en un intento por reducir el número de aviones abatidos por el enemigo, los Aliados estudiaron dónde los aviones que regresaban de sus misiones sufrieron más daño de esta manera, podrían reforzar estas partes.

La conclusión: reforzar las puntas de las alas, los timones y el centro del avión, que es donde identificaron más impactos.

Pero Abraham Wald, un estadístico que trabajó para el departamento de Defensa, propuso algo diferente: reforzar la cabina, los motores y la parte posterior del cuerpo.

¿Y por qué reforzar las áreas donde no hubo impactos?

Lo que no habían considerado era que había un sesgo importante al hacer el estudio: sólo estaban observando los aviones que, a pesar de que sufrieron daños, aún así pudieron regresar a la base. Sin embargo, si un avión recibe daños importantes en la cabina, los motores y la cola, será derribado y, por lo tanto, no podrá regresar a la base.

Así que estos no fueron considerados en el estudio inicial. Este fenómeno es algo que en las estadísticas se llama «sesgo de selección».

A menudo, los datos mal interpretados o la «intuición» nos llevan a tomar decisiones erróneas. Ya decía Nietzsche: «No hay hechos, solo interpretaciones».

 Me pareció una anécdota excelente que podría aplicarse de manera literal a muchos casos de marketing digital con mautic donde la problemática reside justamente la correcta interpretación del creciente aluvión de datos recolectados por las herramientas de analítica y marketing automation.

 

En particular el asunto del sesgo despertó mi curiosidad y acabé en la wikipedia leyendo sobre Sesgo muestral y Sesgo de confirmación, referidos al error en la toma de la muestra debido a suposiciones erróneas del analista. De de ahí salté a todo tipo de Falacias formales e informales, tan utilizadas por los políticos y que la frase “Eat shit: 50 billions flies can’t be wrong”  resume de forma brillante, para finalmente acabar el página de la Generalización apresurada que me recuerda mucho lo que mi padre denominaba la “estadística del pollo” y que decía algo así como: si tu has comido dos pollos y yo ninguno, para las estadísticas los dos tenemos la panza llena…;)

 

Del mismo modo no es raro ver en nuestro sector personas que movidas por la imperiosa necesidad de cumplir con objetivos, por la presión del entorno o, a veces, simplemente movidas por una inquebrantable mezcla de ignorancia y soberbia, quieren ver el proverbial vaso medio lleno y eso les lleva a tener un sesgo equivocado en la toma de las muestras o la interpretación de los datos.

 

Pero las mentiras tienen las piernas cortas y tal y como dijo Abraham Lincoln: “Puedes engañar a algunos todo el tiempo o puedes engañar a todo el mundo algún tiempo pero no puedes engañar a todo el mundo todo el tiempo” y al final los resultados cantan.

 

Así que para concluir, ahora que me he documentado al respecto, crearé mi propia falacia argumental diciendo que “la información es poder pero los datos sin control no sirven de nada” y que cada extraiga la lección que considere más oportuna de todo ello. 

 

Hasta la próxima y que tengas un buen día .