4.4. Errores y sesgos de muestreo
4.4.1. Tipos de errores
Aunque el muestreo esté bien diseñado, dará el valor de un estadístico como estimación de cierta característica de la población, lo que llamaremos parámetro. Por ejemplo, si usamos la muestra obtenida para tener una idea de la altura media de los hongos del video inicial, sólo nos acercaremos al valor real usando el promedio muestral. Además, muestras diferentes darán valores diferentes y el error debido al muestreo estará siempre presente. Pero podremos decir, con cierto grado de confianza, cuál será la magnitud de ese error, lo que llamaremos margen de error y una forma de disminuirlo es eligiendo muestras más grandes. Este tipo de errores se denominan errores aleatorios y surgen de usar una muestra en lugar de la población total.
Pero hay otros errores que no son debidos al muestreo y que podemos llamar equivocaciones. Pueden ocurrir en cualquier encuesta e incluso en los censos, y son posibles en todos los pasos del estudio estadístico. Otro tipo de errores son los debidos a la presencia de sesgos en el muestreo. Los errores de este tipo no son medidos por el margen de error, pueden ser muy grandes, y no se reducen al aumentar el tamaño de la muestra.
Para entender este asunto, podemos usar la analogía del juego del tiro al blanco. Supongamos que el centro del blanco (punto rojo) es el parámetro poblacional al que queremos acertar. Si estamos realizando un muestreo aleatorio, en cada muestra (cada tiro) obtendremos un punto cercano al centro. Algunas veces, el dardo caerá un poco arriba y otras, un poco abajo. Si en cambio el procedimiento tiene sesgo, los valores estarán todos desviados en una misma dirección. Las dos dianas de la izquierda no tienen sesgo mientras que las derecha, sí. El error en la distancia de los puntos negros al rojo no se reduce al aumentar el tamaño de la muestra cuando hay sesgo.