Intervalos de confianza

1 Repaso al Teorema del Límite Central y el Error Estándar

Antes de sumergirnos en los intervalos de confianza, es fundamental refrescar el Teorema del Límite Central (TLC), ya que es la ley matemática que sostiene toda la estadística inferencial.

Imaginemos que tenemos una población con una distribución de datos cualquiera: puede ser una distribución normal, pero también podría ser una distribución totalmente asimétrica, uniforme, o caótica.

El Teorema del Límite Central nos asegura que, independientemente de la forma que tenga esa población original, si extraemos de ella múltiples muestras aleatorias de tamaño \(n\), calculamos la media (\(\bar{x}\)) de cada una de esas muestras y repetimos este proceso infinitas veces, la distribución de todas esas medias muestrales seguirá una Distribución Normal (o Gaussiana).

Para que esta matemática se cumpla, se deben respetar dos condiciones de oro:

Tamaño muestral suficiente: Cada muestra debe tener, por lo general, al menos 30 elementos (\(n \ge 30\)). Si la población original ya es normal, este requisito no es necesario.
Independencia: Los elementos de las muestras deben ser independientes entre sí (el resultado de una observación no debe afectar a la otra).

Además, el teorema nos revela dos propiedades matemáticas cruciales sobre esta nueva distribución de medias:

La Media de las Medias (\(\mu_{\bar{x}}\)): Es exactamente igual a la media de la población original (\(\mu\)).
La Variabilidad de las Medias: Es notablemente menor que la variabilidad de la población original.

La fórmula teórica nos dice que la varianza de la distribución de medias (\(\sigma^2_{\bar{x}}\)) equivale a la varianza de la población (\(\sigma^2\)) dividida entre el tamaño de la muestra (\(n\)):

\[\sigma^2_{\bar{x}} = \frac{\sigma^2}{n} \quad \implies \quad \sigma_{\bar{x}} = \frac{\sigma}{\sqrt{n}}\]

A este último término, \(\sigma_{\bar{x}}\), se le conoce en la práctica como el Error Estándar. Como vemos, el error estándar de la media se calcula dividiendo la desviación estándar de la población (\(\sigma\)) —o en su defecto, la de la muestra (\(s\))— entre la raíz cuadrada del número de elementos de la muestra (\(n\)).

Imagina que analizas las alturas de una población. El rango va desde personas muy bajas (\(1.50\text{ m}\)) hasta personas muy altas (\(2.10\text{ m}\)). Si eliges a una sola persona al azar, tienes una variabilidad enorme (\(\sigma\)); es posible que te toque una persona muy alta de \(2.10\text{ m}\).

Sin embargo, si tomas una muestra de 30 personas al azar y calculas su promedio,lo normal es que en la muestra convivan algunos altos, algunos bajos y muchos de estatura media. Los valores altos se compensan con los valores bajos. Por eso, la media de esa muestra casi siempre va a caer muy cerca del promedio real de la población. Al repetir esto muchas veces, las medias muestrales están muy apretadas alrededor del centro, reduciendo la dispersión a una fracción de la original.

\[\frac{1}{\sqrt{n}}\]

2 Intervalo de confianza

A menudo se confunde la desviación estándar con el error estándar, pero conceptualmente miden cosas totalmente distintas:

La Desviación Estándar (\(\sigma\)): Mide la dispersión de los individuos en la población original.
El Error Estándar (\(SE\)): Mide la dispersión de las medias muestrales. Nos dice qué tan lejos podría estar la media de nuestra muestra respecto a la media real de toda la población.

En la vida real, nosotros solo tomamos una muestra y calculamos una media (\(\bar{x}\)). Sería incorrecto realizar una estimación puntual partiendo de una muestra, porque es posible que la media de la muestra no sea igual a la de la población. En estadística se prefiere dar un rango de valores posibles acompañado de un nivel de confianza (usualmente del \(95\%\)). Eso es un intervalo de confianza.

El intervalo de confianza es un rango delimitado por un valor mínimo y un valor máximo construido a partir de los datos de una muestra. El nivel de confianza (usualmente del 95%) indica la proporción de intervalos que, si repitiéramos el proceso de muestreo infinitas veces, contendrían con éxito el verdadero parámetro poblacional oculto.

Imagina que ya calculamos el intervalo de los salarios a partir de una muestra y tenemos un rango fijo: \([1.902, \; 2.098]\). Solo hay dos opciones:

O el salario real sí está dentro de ese rango.
O el salario real no está dentro de ese rango.

Si repitiéramos este experimento e hiciéramos 100 muestreos diferentes, calculando 100 intervalos de confianza distintos, 95 de esos 100 intervalos capturarían el verdadero valor de la población y 5 de ellos se equivocarían.

3 Cálculo del intervalo de confianza

El intervalo de confianza es cálcula mediante un valor crítico y el error estándar. Mediante esta formula calculamos el rango fijo, con un mínimo y un máximo.

\[\text{Intervalo de Confianza} = \bar{x} \pm \left( Z \cdot SE \right)\]

El valor crítico es el número de errores estándares que necesitas alejarte de la media para encerrar el porcentaje de datos que deseas. Es un valor que se obtiene a partir de unas tablas de distribución estadística.

Defines el nivel de confianza (\(1 - \alpha\)): Por ejemplo, un 95% (0.95).
Calculas el nivel de significancia (\(\alpha\)): Es el riesgo de quedar fuera, es decir, el 5% restante (0.05).
Repartes el riesgo en dos colas (\(\alpha / 2\)): Como el intervalo de confianza tiene dos paredes (un mínimo y un máximo), el riesgo de fallar se divide por igual en los dos extremos de la campana. \[0.05 / 2 = \mathbf{0.025}\]
Buscas cuál es el valor exacto en el eje horizontal que deja exactamente un 2.5% de área en la cola exterior.

Casi siempre se utilizan los mismos niveles de confianza, los valores críticos de la Distribución Normal (\(Z\)) ya estan calculados, para un nivel de confianza del 95% habría un riesgo en cada cola del 2.5% y esto lleva a una valor crítico de 1.96.

Si la muestra es pequeña, no se usa la tabla \(Z\) (Normal), sino la tabla t de Student. En esta tabla, además se pide lo grados de libertad(df=n−1). Al haber más incertidumbre en muestras pequeñas, el valor crítico t siempre te dará un número un poco más alto que 1.96 para hacer el intervalo más seguro.

Imagina que haces una encuesta de salarios a \(n = 100\) personas. La media de tu muestra es \(\bar{x} = 2,000\) y la desviación estándar de los datos es \(s = 500\).Calculamos el Error Estándar:

\[SE = \frac{500}{\sqrt{100}} = \frac{500}{10} = \mathbf{50}\]

La desviación estándar utilizada es la de la muestra, por eso se representa con “s”. Nuestra estimación de la media tiene un “vaivén” típico de \(50\) por pura culpa del azar del muestreo.

\[\text{Margen de Error} = 1.96 \cdot 50 = \mathbf{98}\] \[\text{Intervalo} = 2000 \pm 98 \implies \mathbf{[1902, \; 2098]}\]

from scipy import stats
import math

confianza = 0.95
alfa_mitad = (1 - confianza) / 2

z_critico = stats.norm.ppf(1 - alfa_mitad)

print(f"El valor crítico Z para {confianza*100}% es: {z_critico:.3f}")


# Datos de nuestra muestra
n = 15                 # Tamaño de la muestra
confianza = 0.95       # Nivel de confianza
desviacion_m = 500     # Desviación estándar de la muestra

grados_libertad = n - 1
alfa_mitad = (1 - confianza) / 2

t_critico = stats.t.ppf(1 - alfa_mitad, df=grados_libertad)

print(f"Valor crítico t para {confianza*100}% de confianza (n={n}): {t_critico:.3f}")

El valor crítico Z para 95.0% es: 1.960
Valor crítico t para 95.0% de confianza (n=15): 2.145

Conceptualmente, la teoría estricta dice que siempre que no conozcamos la desviación estándar poblacional deberíamos usar la \(t\) de Student. Sin embargo, en la práctica tradicional, cuando la muestra supera los 30 elementos, la distribución \(t\) converge de forma tan precisa hacia la Normal que utilizar los valores críticos de \(Z\) (como el 1.96) ofrece una aproximación matemática aceptada universalmente.