Tabla de contenidos
¿Qué es la distribución normal?
La distribución de probabilidad normal es sumamente importante para la inferencia estadística por sus vastas aplicaciones prácticas en áreas como el control de calidad, finanzas, economía, ingeniería, demografía, etc. Se representa mediante una curva simétrica y continua con forma de campana, en la cual se observa que los valores de una variable aleatoria se distribuyen alrededor de su media.
La función de densidad de probabilidad que define la curva normal es la siguiente:

Donde, μ es la media, σ es la desviación estándar, π es una constante igual a 3.14159 y e es otra constante cuyo valor es 2.71828. Graficando para μ=4 y σ=0.5, tenemos:

Como ya se ha señalado, la distribución normal tiene forma de campana. Los parámetros μ y σ determinan su localización y forma. Por ejemplo, la siguiente gráfica muestra que, al fijar el valor de la desviación estándar (σ=1) y variar la media (μ), la curva normal se desplaza a izquierda o derecha:

En cambio, si fijamos la media (μ=0) y variamos la desviación estándar, tenemos la siguiente gráfica:

Como se ha visto, la media de una distribución normal puede ser negativa, cero o positiva. Entre más grande es la desviación estándar, mayor es la dispersión de los datos. Una desviación estándar grande se relaciona con curvas normales más planas y anchas, la razón es que los datos se encuentran más dispersos, en otras palabras, la variabilidad de los datos es mayor. Además, el punto más alto de la curva normal corresponde a la media, mediana y moda. Tomando como referencia la media, la distribución normal es simétrica, el lado izquierdo es una imagen especular del lado derecho, esto significa que su sesgo es igual a cero, es una distribución no sesgada. Ambas colas de la curva normal se extienden infinitamente y, teóricamente, nunca tocan el eje horizontal.
Dado que es una distribución de probabilidad continua, el área bajo la campana es igual a 1, recordando que es simétrica, el área se reparte equitativamente, 0.5 a la izquierda de la media y 0.5 a la derecha de la media. Muy importante, la probabilidad de la variable aleatoria continua se determina calculando el área bajo la curva normal.
Distribución normal estándar
La distribución normal estándar es una distribución normal con media igual a cero (μ=0) y desviación estándar igual a 1 (σ=1). La variable aleatoria de una distribución normal estándar se denota con la letra z. Dadas estas características, la función de densidad de probabilidad normal estándar es la siguiente:

Afortunadamente, para calcular la probabilidad se cuenta con tablas que proporcionan las áreas bajo la curva normal, siendo así, podemos prescindir del cálculo integral. Por ejemplo, la probabilidad de que z sea menor o igual a 1.5 (P(z≤1.5)) es una probabilidad acumulada, puesto que es el área sombreada bajo la curva normal a la izquierda de z=1.5, tal y como se muestra en la siguiente gráfica:

Al consultar la tabla de distribución de probabilidad normal estándar, la probabilidad acumulada asociada a z=1.5 es igual a 0.93319. Para encontrar este valor en la siguiente tabla, primero localizamos el renglón cuyo encabezado es 1.5, luego nos desplazamos a la primera columna a la izquierda con el encabezado 0.00, en la intersección de renglón y columna, leemos 0.93319. Entonces, P(z≤1.5)=0.93319.

Sabiendo que P(z≤1.5)=0.93319 y que el área total debajo de la curva normal es igual a 1, podemos calcular la probabilidad de que z sea mayor a 1.5 (P(z>1.5)), restando 0.93319 de 1:

Esta probabilidad corresponde al área bajo la curva normal a la derecha de z=1.5, tal y como se muestra en la gráfica anterior.
¿Cuál es la probabilidad de que la variable aleatoria z se encuentre a no más de dos desviaciones estándar de la media, P(-2≤z≤2)? En tablas, encontramos que P(z≤2)=0.97725, luego P(z≤-2) la calculamos de la siguiente manera:

Por último, restamos P(z≤-2) de P(z≤2):

En la siguiente gráfica, se muestra el área sombreada bajo la curva normal que corresponde a P(-2≤z≤2). Para comprender el procedimiento anterior y recordando que la curva normal es simétrica, es importante notar que las áreas no sombreadas en los extremos de las colas son iguales, es decir:


Hallar el valor z a partir de una probabilidad
Otro problema consiste en encontrar el valor de z dada una probabilidad. Nuevamente, se recurre a las tablas. Por ejemplo, si la probabilidad es 0.90658, el valor z correspondiente es 1.32. El primer paso es buscar la probabilidad más cercana a 0.90658, luego buscamos el encabezado del renglón en el que encontramos dicha probabilidad (1.3), enseguida identificamos el encabezado de la columna asociada a la probabilidad buscada (0.02), así obtenemos 1.32 (1.3 y 0.02).

Si la probabilidad dada es 0.82601, el valor de z es 0.94. Al buscar en las tablas, no encontramos exactamente 0.82601, pues se encuentra entre 0.82381 y 0.82639. Sin embargo, la probabilidad acumulada más cercana es 0.82639, luego identificamos el encabezado del renglón asociado a esta probabilidad (0.9) y después el encabezado de la correspondiente columna (0.04), de tal modo que z=0.94 (0.9 y 0.04).

Si el área bajo la curva en la cola superior es 0.05, entonces, el área bajo la curva normal a la izquierda del valor desconocido de z es igual a 0.95, es esta probabilidad acumulada la que buscamos en las tablas. La probabilidad acumulada más cercana es 0.94950, misma que corresponde a un valor z igual a 1.64, la probabilidad aproximada de que z sea menor a 1.64 es igual a 0.95, lo que implica que la probabilidad aproximada de que z sea mayor o igual a 1.64 es igual a 0.05, P(z≥1.64)=0.05.

Tablas de la distribución de probabilidad normal estándar
Como se ha explicado en los ejemplos previos, es posible usar las tablas para encontrar una probabilidad acumulada dado un valor para la variable aleatoria z, también es posible encontrar un valor de z dada una probabilidad. Una gráfica de la distribución de probabilidad normal estándar puede ser de ayuda para entender el problema que se quiere resolver. A continuación, se proporcionan las tablas de la distribución de probabilidad normal estándar:


Cálculo de probabilidades de cualquier distribución de probabilidad normal
Sea una distribución normal con media μ y desviación estándar σ, las preguntas sobre las probabilidades de esta distribución se contestan después de pasar a la distribución normal estándar. Para convertir una variable aleatoria x con media μ y desviación estándar σ a la variable aleatoria normal estándar z se utiliza la siguiente fórmula:

Es importante notar que cuando la variable aleatoria x es igual a su media (x= μ), el valor z es igual a cero:

Si la variable aleatoria x se localiza a una desviación estándar por arriba de la media (x=μ+σ), el valor de z es igual a 1:

Entonces, z se puede interpretar como el número de desviaciones estándar a las que está una variable aleatoria x de su media μ. El punto z es una medida de localización relativa, pues determina lo lejos que un valor se encuentra de la media: el 68.3% de los datos se encuentran a una desviación estándar de la media, el 95.4% de los datos a dos desviaciones estándar de la media y el 99.7% de los datos a tres desviaciones estándar de la media.

Consideremos una distribución normal con una media igual a 4 (μ =4) y una desviación estándar igual a 0.5 (σ=0.5). ¿Cuál es la probabilidad de que la variable aleatoria x se encuentre entre 3 y 4.5, P(3≤x≤4.5)? Calculamos los valores z de los extremos del intervalo:

Los resultados indican que 3 se encuentra a dos desviaciones estándar a la izquierda de la media, y 4.5 a una desviación estándar a la derecha de la media. Reformulemos la pregunta en términos de z: ¿cuál es la probabilidad de que la variable aleatoria z se encuentre entre -2 y 1, P(-2≤z≤1)? Después de consultar las tablas, tenemos:

La probabilidad de que la variable aleatoria x se encuentre entre 2 desviaciones estándar debajo de su media y a 1 desviación estándar arriba de su media es igual a 0.81859. En otras palabras, la probabilidad de que la variable aleatoria x se encuentre entre 3 y 4.5 es igual a 0.81859.
Ejemplo de aplicación de la distribución de probabilidad normal estándar
Sea x una variable aleatoria continua normalmente distribuida, la cual de define como las horas de duración de un teléfono celular en condiciones normales de uso. Después de realizar pruebas, el fabricante estima una duración media de 20,000 horas de uso (μ =20,000) y una desviación estándar igual a 3,000 horas de uso (σ=3,000). ¿Cuál es la probabilidad de que los teléfonos celulares duren más de 25,000 horas, P(x>25,000)?
Comenzamos calculando z:

Dado este resultado respondemos la pregunta: ¿cuál es la probabilidad de que la variable aleatoria z sea mayor que 1.67, P(z>1.67)? Haciendo uso de las tablas, sabemos que la probabilidad de que z sea menor o igual a 1.67 es igual a 0.95254.

Por lo tanto, P(z>1.67) se calcula restando P(z≤1.67) de 1:

La probabilidad de que un teléfono celular dure 25,000 horas en condiciones normales de uso es igual a 0.04746. El fabricante ofrece una garantía relacionada con el tiempo de uso en condiciones normales de operación, ¿cuál debe ser la duración estipulada en la garantía si se desea que no más del 15% de los clientes la hagan efectiva?
Ahora, tenemos una probabilidad (0.15) y un valor de z desconocido, como las tablas proporcionan la probabilidad acumulada buscamos la probabilidad acumulada más cercana a 0.85 (1-0.15), la cual es 0.85083, luego identificamos los encabezados del reglón y columna correspondientes, resultando un valor z igual a 1.04. Entonces, podemos escribir que:

Luego, tenemos que:

No obstante, esta probabilidad se relaciona con el área que se encuentra debajo de la cola derecha de la curva normal, para que corresponda con el área debajo de la cola izquierda escribimos:

El valor de x que corresponde a z=-1.04, lo calculamos de la siguiente manera:

El umbral de la garantía para que no más del 15% de los clientes la hagan efectiva es igual a 16,880 horas de uso en condiciones normales de operación. Esto es, P(x<16,880)=0.15.