Cómo generar un estudio falso 4


Todo está falseado. Todo. Tanto en el mundo laboral como en el académico las cifras se distorsionan para que resulte el valor buscado en vez de analizar dónde ha estado el fallo de medida. Se retoca, se repinta. ¿Queda bonito? Pues ya está, a entregar.

Estudio falso

Mi comienzo con los datos falsos

Recuerdo una práctica en la universidad que trataba de determinar la aceleración de la gravedad en la superficie de la Tierra usando un pequeño péndulo y un cilindro que giraba. Nadie entendía la mecánica de la práctica, que ejecutábamos como soldados a las órdenes del profesor sin preocuparnos nunca de que esas órdenes tuviesen o no sentido. Y, en ocasiones, no las tenían. Alguien la cagó, y al medir la aceleración de la gravedad obtuvimos un magnífico +2,44·g.

Para los que se pierdan en este asunto, diré que la gravedad en la superficie de la Tierra es de – 9,8m/s2 (ese “dos” es un cuadrado). Para empezar, es negativa (va hacia el centro de la Tierra, y su valor es similar a 10, no a 25. Según el resultado de nuestro experimento, la Tierra expulsaba los objetos hacia el espacio a una aceleración de más del doble que la que provoca nuestro peso. Básicamente la Tierra era un enorme cañón que disparaba los objetos contra el cielo. Algo que, obviamente, no ocurría en la realidad.

Teníamos dos opciones:

  1. Lanzar cosas al aire durante la presentación de la práctica a ver si colaba nuestro resultado.
  2. Falsificarla saltando olímpicamente sobre la moral con objeto de no tener que repetirla.

Obviamente elegimos lo segundo, y calculamos los datos de partida en orden inverso, preguntándonos: ¿Qué tendría que medir tal o cuál valor para que la aceleración diese correcta? Nos dio clavada, y sacamos buena nota (buena nota puede ser un 5,0).

Hazlo en tu casa: falsifica un experimento

Seguramente que tú hayas tenido la necesidad en algún momento de presentarle a alguien datos que no son reales de estudios que no existen. Si no es así, poco camino llevas. Guárdate este artículo porque lo usarás en algún momento. Y, si tienes a algún universitario cerca, pásaselo. Le ayudará en sus prácticas.

Los datos de partida son falsos, obviamente. Precisamente, son aquellos que tendremos que generar para que las conclusiones de nuestro experimento resulten aquellas que queremos o buscamos. Es por eso que vamos a darle la vuelta al experimento y a empezar por los resultados finales.

ESTUDIO INVENTADO

Falsifica tu experimento, paso por paso

Vamos a crear desde cero un experimento que diga que la media de estatura se encuentra entorno a 190 centímetros. No sé cuál es la cifra correcta, pero eso no importa. Lo importante es que vamos a  demostrar, con datos (inventados) que la media de un conjunto es de 190 cm de altura.

Para ello necesitamos datos de un experimento que no tenemos. Y que, además, no podemos conseguir “por las buenas”. Principalmente porque la media seguro que dista de esos 190 cm. Ahora entenderéis por qué uso los cm en vez de los metros.

Modo 1. Función ALEATORIO.ENTRE

Para nuestro experimento solo necesitamos una hoja de Excel. Es un método sencillo. Colocaremos en la primera casilla la fórmula:

=ALEATORIO.ENTRE(180;200)

Excel 1

 

Esto nos devolverá números entre 180 y 200 como si lanzásemos un dado de 20 caras (20 = 200 – 180) en las que apareciesen pintados los números entre 200 y 180. Basta arrastrar esa ecuación hacia abajo en la hoja excel para tener todos los resultados que queramos:

Excel 2

Cuantos más datos tengamos, más probabilidad hay de que la media salga cerca de “190 cm”, el valor buscado. Se realiza en cm porque la función “ALEATORIO” solo devuelve números enteros.

Modo 2. Dando realismo a datos inventados

Vale, inventarse datos para un estudio científico es fácil. Basta con sacar muchos datos de la chistera de ALEATORIO en Excel y ya está. El problema es que estos datos tienen una estructuración totalmente al azar. Es decir: todos los números tienen las mismas posibilidades de salir. Así, tomando 1000 muestras falsas de alturas, obtenemos lo siguiente:

Excel 3

En teoría eso es una distribución normal, o una Campana de Gauss, pero de Campana de Gauss no tiene nada. Porque no son así. Los datos son más falsos que la ruka, y eso se aprecia a nivel estadístico. De modo que vamos a aprender a fabricar datos de estudio más realistas.

Para ello, necesitaremos varias columnas de Excel con la fórmula =ALEATORIO.ENTRE(x;y). La primera columna la podemos hacer de 1000 valores (como la que teníamos), entre 180 y 200.

Yo para el ejemplo he creado la segunda con 800 valores entre 182 y 198 cm, y una tercera columna de 600 valores entre 183 y 197 cm. Si os fijáis lo que hago es lo siguiente:

  • cojo menos valores para cada tramo;
  • cada tramo siempre da 190 de media (que es la media a la que quiero que tiendan los valores);
  • cada tramo se acerca más al valor 190 por arriba y por abajo.

Esto lo que hace es compactar los datos entorno al valor 190 como harían datos realistas en un estudio serio (y no inventado). Este es el resultado de juntar los valores de esas tres columnas diferentes en una sola y repetir la Campana de Gauss:

Excel 5

Ahora sí que tenemos un experimento coherente. Inventado, pero coherente.

Ya estáis preparados para inventaros vuestras propias métricas con cientos de miles de datos que podréis mostrar ante cualquiera que os pregunte. Cuantos más, mejor ;)

Si te ha servido de algo esta canallada a la ciencia, comparte porfi :)

  • CrisMandarica

    Me he perdido pero te he entendido, que conste. Biquiños!

    - Tuitea este comentario

    • http://www.pensamientolateral.org/ Marcos Martinez

      Te has encontrado al final. =)

      - Tuitea este comentario

  • Osco

    También tienes la función =DISTR.NORM(), que está en el apartado de funciones de compatibilidad ;)

    - Tuitea este comentario

    • http://www.pensamientolateral.org/ Marcos Martinez

      Sí esa es una función para imprimir los valores iniciales en forma de campana de Gauss, asignando con la media y la desviación estándar valores en Y. Es lo que he hecho para las gráficas que están a la derecha. Pero los datos deben seguir una distribución normal, si no salen aberraciones.

      :D

      #friki

      - Tuitea este comentario