Muestreo bla, bla, bla. Mayo 29, 2008
Posted by psirusteam in Inferencia, Muestreo, Uncategorized.Tags: Biografías, Diseño experimental, Efecto de diseño, Leslie Kish, Modelos
trackback
En la primera página de cualquier libro de texto clásico de inferencia estadística se lee lo siguiente:
Dadas n variables aleatorias, seleccionadas de una población, independientes e idénticamente distribuidas, para estimar el parámetro…
Cada palabra en el anterior enunciado es engañosa. ¿Quién le da a uno las muestras? ¿Existe algún sitio en dónde las repartan? Las muestras no son dadas, las muestras deben ser seleccionadas, asignadas o capturadas. El tamaño de la muestra no siempre es un número n fijo, en la mayoría de casos prácticos es una variable aleatoria. Los datos no siguen el supuesto de independencia ni de idéntica distribución; es más, en muchas ocasiones no existe una sola población, sino que la muestra seleccionada es el resultado de una selección de sub-poblaciones para las cuales se deben producir, no sólo una estimación sino un montón de estimaciones. Así que la historia que nos contaron no aplica en la mayoría de situaciones prácticas.
Esta afirmación fue hecha por una de las cabezas más brillantes (no sólo por su capacidad intelectual) del muestreo, el respetado Dr. Leslie Kish quien, también sugirió que se debería realizar una acotación en la academia en el momento de analizar la información con cualquier software de tipo estadístico como SPSS o TESI. Se debe tener conciencia de que los datos que se están analizando no han sido seleccionados mediante muestreo aleatorio simple con reemplazo y por lo tanto el cálculo de errores estándar que arrojaría el software resulta ser inapropiado. Es hora de que los paquetes estadísticos incluyan en sus análisis rutinas que permitan el ajuste del diseño de muestreo utilizado en la recolección de los datos, por ejemplo por conglomerados o estratos, que no han sido seleccionados mediante muestreo aleatorio simples con reemplazo.
Kish motivó a los estadísticos aplicados a entender completamente la relación existente entre conceptos tales como estratificación y regresión lineal. El lector debe notar que Kish ayudó a crear un departamento de Bio-estadística en los Estados Unidos que combina el diseño experimental y el muestreo, él afirma que estas dos ramas están ligadas en sus raíces por el principio de aleatorización.
Así mismo, afirmó que los libros actuales de muestreo no cumplen el cometido de enseñar el análisis adecuado de la información para la selección de muestras en una población, en vez de esto se dedican a enseñar fórmulas sin preocuparse realmente por la enseñanza del diseño de muestreo que ha venido siendo reemplazado por la inferencia basada en modelos poblacionales sin tener en cuenta el principio de aleatorización. Como Tukey dijo: Abrace a sus datos no al modelo. Los modelos pueden jugar papeles muy importantes en problemas de tipo genético o físico, pero juegan roles menos importantes en las ciencias sociales. No podemos vivir enteramente sin modelos, porque en un ejercicio práctico existe ausencia de respuesta y problemas del marco de muestreo. Los modelos deberían decir qué variables se tienen que incluir en una regresión y posiblemente la forma funcional de las ecuaciones. Sin embargo, los modelos no dicen el valor que los coeficientes de regresión toman y estas estimaciones están sujetas a variaciones de muestreo y efectos de diseño.
De todos los universos que se puedan suponer, en la vida práctica no existe ninguno que siga el patrón de la urna con bolas bien revueltas. En la práctica se trata con universos complejos y por tanto se deben utilizar diseños de muestreo complejos que contemplen el efecto de diseño.



Apreciado blogger,
Defensor de la teoría, como soy, tengo que alegar que el hecho de la violación en los supuestos no supone un error en el razonamiento matemático. Así, por ejemplo, la palabras «dadas» se traduce en matemáticas como «para todas».
Recuerdo que mi desdicha con el muestreo era por el lado inverso, la teoría me pareció bonita porque trabajaba con varios concepos probabilísticos que hacían parecer divertida la matemática que soportaba al muestro un juego. Pero me desesperó la misma cosa aunque por otra razón: me desesperó la violación continua en campo de los supuestos, y la razón es por la que me molestaba es porque podían hacer inválidas las conclusiones (implicaciones) de esos resultados teóricos pero sin mebargo seguirlos tratando como si fuera cierto.
El punto es que curiosamente ante el mismo fenómeno tenemos una diferencia a partir de la misma situación (usted desde su lado más práctico, yo desde mi lado más teórico), lo cual, dadas las perspectivas individuales, es hasta obvio.
Sin embargo, sí hay algo que debo alegar y es la efectividad de los modelos de urnas para modelar los movimientos de partículas (una situación real). La utilidad de conceptos como las urnas no es de poca monta a nivel científico. La probabilidad de selección (muestreo) de una bola blanca, digamos, tiene todo que ver con el funcionamiento a nivel cuántico de las partículas en cuando a la probabilidad de ser «seleccionada» para atravesar una superficie, por ejemplo. Se sorprendería de ver el «ajuste fino» entre las matemáticas teóricas y la realidad física, incluso cuando las dos han sido desarrolladas de forma independiente. A propósito de eso lo invito a leer este corto pero diciente artículo de Science Daily en el 2003: http://www.sciencedaily.com/releases/2003/07/030725081432.htm.