Menú Cerrar

Muestreo aleatorio simple, ejemplo, con reemplazo, sin remplazo

Introducción

La inferencia estadística tiene como propósito realizar estimaciones y pruebas de hipótesis acerca de los parámetros poblacionales mediante la información que proporciona una muestra. Debemos recordar que la media y desviación estándar de una población se conocen como parámetros o parámetros poblaciones.

Algunas situaciones en las que es posible obtener parámetros poblacionales a partir de muestras son: encuestas electorales en la que se pregunta a 1000 personas por quién votarán, luego con esta información se estima la intención de voto para cada candidato en toda la población; una tienda encuesta a 400 clientes para estimar la satisfacción promedio en relación al servicio recibido; una estación de inspección de calidad toma una muestra de 50 productos aleatoriamente para estimar la proporción de productos defectuosos; se encuesta a 900 hogares para estimar el ingreso promedio mensual de la población de una ciudad; una empresa de última milla registra los tiempos de entrega de una muestra de 500 envíos para estimar el tiempo promedio de entrega de su flota; un fabricante de componentes electrónicos selecciona una muestra de 100 chips para estimar su tiempo medio de vida útil en condiciones normales de operación; etc.

Las muestras son útiles porque determinar el tiempo medio de vida útil de cada chip implicaría usar cada chip hasta que falle. En otros casos, como las preferencias electorales, es inasequible preguntar a toda la población, la razón son los altos costos que esto conlleva. No obstante, debemos tener en cuenta que los resultados muestrales proporcionan una estimación de las características de la población, esto significa, por ejemplo, que la media muestral no sea exactamente igual a la media poblacional, pues la muestra contiene información de una parte de la población, pero un método de muestreo adecuado garantiza buenas estimaciones de los parámetros poblacionales.

Muestreo aleatorio simple

El muestreo aleatorio simple es un método utilizado para seleccionar una muestra de una población, su definición depende de si la población es finita o infinita.

Muestreo aleatorio simple en una población finita

El muestreo aleatorio simple de una población finita consiste en seleccionar una muestra de tamaño n de una población de tamaño N de manera que cada muestra de tamaño n tenga la misma probabilidad de ser seleccionada. Así, cada elemento de la población tiene la misma probabilidad de ser incluido en la muestra.

Si realizamos un muestreo eligiendo los elementos de uno en uno, cada elemento que queda en la población tendrá la misma probabilidad de ser seleccionado, lo que satisface la definición de muestro aleatorio simple en una población finita.

En una población de estudiantes universitarios podemos estimar el promedio de horas de estudio por semana, la media del número de materias inscritas, el transporte más frecuentemente usado para llegar al campus, la variabilidad de las horas de estudio por semana, la proporción de estudiantes que estudian y trabajan, la proporción de estudiantes que pertenecen a asociaciones estudiantiles, la tasa de aprobación de las materias, preferencias por modalidades de clase (en línea, presencial, híbrida), etc.

Consideremos que una universidad con una población de 2,000 estudiantes (N=2,000) desea estimar el promedio de horas de estudio por semana, el transporte más frecuentemente usado para llegar al campus, la proporción de estudiantes que estudian y trabajan y las preferencias por modalidades de clase (en línea, presencial, híbrida). En tal caso, un censo sería costoso y requeriría mucho tiempo, razón por la que se decide realizar un muestreo aleatorio simple. El primer paso consiste en asignar un número a cada estudiante en el orden en que aparecen sus nombres en el registro de la universidad, para lo cual se recurre a una tabla de número aleatorios como la siguiente:

El primer grupo de cinco dígitos que leemos es 53491, cada uno de estos es un dígito aleatorio. Dado que se tiene una población de 2,000 estudiantes, el mayor número asignado a un estudiante es 2,000, el cual tiene cuatro dígitos, por lo que seleccionamos grupos de cuatro dígitos de la tabla de números aleatorios. Podemos comenzar en cualquier lugar de la tabla, avanzando en una de las cuatro direcciones posibles. Al comenzar en el primer renglón y avanzar de izquierda a derecha tenemos los siguientes grupos de cuatro dígitos: 5349, 1198, 3554, 7108, 1594, 0078, 8156.

Estos siete números de cuatro dígitos son igualmente posibles, de esta manera cada uno de los estudiantes de la población tienen la misma oportunidad de ser incluidos en la muestra aleatoria. El primer número, 5349, es mayor que 2000, por lo que no corresponde a ningún estudiante y se descarta. El segundo número, 1198, corresponde al estudiante al que se le haya asignado el número 1198, luego este estudiante se incluye en la muestra. El proceso continúa de la misma manera, ignoramos los siguientes dos números, 3554 y 7108, por no corresponder a ningún estudiante. Luego, los estudiantes con los números 1594 y 0078 son considerados para la muestra. El número 8156 se ignora por ser mayor que 2000. El proceso termina cuando se ha alcanzado una muestra aleatorio de tamaño n.

Se asume que el muestreo es sin reemplazo, es decir, si se repite un número, lo ignoramos, ya que no se requiere entrevistar a un estudiante más de una vez. En caso contrario, si se aceptan números aleatorios ya utilizados, se dice que el muestreo se realiza con reemplazo.

El número de muestras aleatorias simples distintas de tamaño n que pueden seleccionarse de una población finita de tamaño N se determina con la regla de conteo de para combinaciones.

Muestreo aleatorio simple en una población infinita

Si se trata de una muestra aleatoria simple en una población infinita cada uno de los elementos seleccionados debe provenir de la población y debe ser seleccionado independientemente, esto último significa que la selección de un elemento no afecta las probabilidades de ser elegido de los siguientes.

Pensemos en una línea de producción en la que se toman piezas al azar para estimar la proporción de productos defectuosos, un generador aleatorio garantiza que se seleccione cada pieza en intervalos de tiempo independientes. Otro ejemplo es el análisis de muestras de aire para medir concentraciones de contaminantes, para garantizar la independencia se puede recurrir a un temporizador que active el muestreador aleatoriamente. Las transacciones en un banco, las llamadas a un centro de atención telefónica y las llegadas de clientes a cualquier negocio son otros ejemplos en los que la población se considera infinita por tratarse de un proceso continuo.

Consideremos una zapatería que desea analizar a su clientela mediante un breve cuestionario, la población se considera infinita, pues las llegadas de los clientes es un proceso continuo, lo que hace imposible enumerar a los clientes. Para seleccionar a los clientes asegurando la independencia en la selección, la zapatería determinó incluir en la muestra a cada cliente que aparezca justo después de un cliente que presente un cupón de descuento.

La independencia es crucial para evitar sesgos. En una escuela, se selecciona a cada estudiante mediante un generador aleatorio de matrículas. En la vía pública, se selecciona a la n-ésima persona mediante un algoritmo, no se entrevista a las personas que más extrovertidas o disponibles.

Uso de Excel para generar números aleatorios

Existen algunas funciones en Excel que devuelven números aleatorios, lo cual es útil para el muestreo. La función ALEATORIO.ENTRE devuelve un número entero aleatorio entre los números que se especifiquen mediante los argumentos inferior y superior. Por ejemplo, si queremos un número aleatorio entre 5 y 55 escribimos la fórmula en una hoja de Excel como sigue:

Aunque la función puede devolver cualquier número entre 5 y 55, en nuestro caso la función devolvió el siguiente resultado:

La función aleatorio no tiene argumentos y devuelve un número aleatorio mayor o igual a 0 y menor que 1. En la siguiente imagen, la celda B2 muestra la función en su manera simple, la celda B3 muestra la manera de escribir la función para que nos devuelva un número entre 8 y 4, la celda B4 devuelve un número entero entre 8 y 4:

El resultado es el siguiente:

La función MATRIZALEAT devuelve una matriz de números aleatorios, sus argumentos son los siguientes: filas es el número de filas en la matriz de números aleatorios, columnas es el número de columnas, min es el elemento con el valor más pequeño que puede aparecer en la matriz, max es el elemento con el valor más grande que puede aparecer en la matriz, entero es igual a cero si se admiten números decimales como elementos de la matriz y es igual a 1 si solamente se admiten números enteros. La siguiente imagen muestra la manera en que se escribe la fórmula para obtener una matriz de 4 filas, 3 columnas, con un valor mínimo igual a 5, un valor máximo igual a 20 y admitiendo decimales.

El resultado es el siguiente:

Cómo citar

García, Miguel. (20 abril 2025). Muestreo aleatorio simple, ejemplo, con reemplazo, sin remplazo. Celeberrima.com. Última actualización el 21 abril 2025.