Cuando los datos son muchos y se agrupan en intervalos, las fórmulas cambian. Aprende a calcular las tres medidas de tendencia central con tablas de frecuencias agrupadas, paso a paso y con interpretación de cada resultado.
Media, mediana y moda para datos agrupados
¿Por qué agrupar los datos en intervalos?
Imagina que tienes las edades de 500 personas, los pesos de 300 atletas o las notas de 1.000 estudiantes. Trabajar con cada dato individual sería inmanejable. La solución es agrupar los datos en intervalos y resumir la información con una tabla de frecuencias.
Con 200 datos, es imposible ver la tendencia a simple vista.
[165,170): 38 personas
[170,175): 74 personas
[175,180): 51 personas
[180,185): 25 personas
De un vistazo se ve la distribución.
Al agrupar los datos se pierde precisión individual, pero se gana visión global. Como ya no conocemos cada valor exacto dentro del intervalo, las fórmulas de la media, la mediana y la moda deben adaptarse. El punto clave es el concepto de marca de clase.
La tabla de frecuencias para datos agrupados
Antes de calcular cualquier medida, hay que construir la tabla de frecuencias completa. Para datos agrupados, esta tabla tiene más columnas que para datos sin agrupar, porque cada columna adicional es necesaria para alguna de las fórmulas.
Columnas de la tabla y su utilidad
| Columna | Símbolo | Cómo se obtiene | Para qué sirve |
|---|---|---|---|
| Intervalo | \([L_i,\, L_{i+1})\) | Se dan en el enunciado | Define los grupos |
| Marca de clase | \(x_i\) | \(\dfrac{L_i + L_{i+1}}{2}\) | Representa el intervalo en la media |
| Frec. absoluta | \(f_i\) | Se dan en el enunciado o se cuentan | Base de todos los cálculos |
| Frec. absoluta acumulada | \(F_i\) | \(F_i = F_{i-1} + f_i\) | Necesaria para la mediana |
| Frec. relativa | \(h_i\) | \(h_i = f_i / n\) | Proporciones y porcentajes |
| Producto \(f_i \cdot x_i\) | \(f_i x_i\) | Frecuencia por marca de clase | Necesario para la media |
La media aritmética para datos agrupados
¿Cómo cambia la fórmula?
Para datos individuales, la media se calculaba sumando todos los valores y dividiendo entre n. Para datos agrupados, como no conocemos los valores exactos de cada dato, los sustituimos por la marca de clase del intervalo al que pertenecen. La fórmula pasa a ser una media ponderada.
Ejemplo resuelto — Media de alturas
La marca de clase \(x_i\) es el punto medio del intervalo: \(x_i = (L_i + L_{i+1})/2\). El producto \(f_i \cdot x_i\) se obtiene multiplicando cada frecuencia por su marca de clase correspondiente.
| Intervalo | Marca de clase \(x_i = \frac{L_i+L_{i+1}}{2}\) | Frec. absoluta \(f_i\) | Producto \(f_i \cdot x_i\) |
|---|---|---|---|
| [155, 160) | \(\frac{155+160}{2} = 157{,}5\) | 3 | \(3 \times 157{,}5 = 472{,}5\) |
| [160, 165) | \(\frac{160+165}{2} = 162{,}5\) | 7 | \(7 \times 162{,}5 = 1.137{,}5\) |
| [165, 170) | \(\frac{165+170}{2} = 167{,}5\) | 14 | \(14 \times 167{,}5 = 2.345\) |
| [170, 175) | \(\frac{170+175}{2} = 172{,}5\) | 10 | \(10 \times 172{,}5 = 1.725\) |
| [175, 180) | \(\frac{175+180}{2} = 177{,}5\) | 6 | \(6 \times 177{,}5 = 1.065\) |
| Totales | — | 40 | 6.745 |
La mediana para datos agrupados
¿Cómo se calcula?
Para datos agrupados, la mediana no se obtiene leyendo un dato de una posición concreta, sino mediante interpolación lineal dentro del intervalo mediano. La idea es localizar primero el intervalo donde cae la mitad de los datos y luego estimar el valor exacto dentro de ese intervalo.
Pasos para encontrar la mediana
Ejemplo resuelto — Mediana de alturas
| Intervalo | \(f_i\) | \(F_i = F_{i-1}+f_i\) |
|---|---|---|
| [155, 160) | 3 | 3 |
| [160, 165) | 7 | 10 |
| [165, 170) | 14 | 24 ← supera n/2 = 20 |
| [170, 175) | 10 | 34 |
| [175, 180) | 6 | 40 |
El intervalo mediano es [165, 170).
La moda para datos agrupados
¿Cómo cambia?
Para datos individuales, la moda era simplemente el valor que más se repetía. Para datos agrupados, primero se identifica el intervalo modal (el de mayor frecuencia) y luego se estima el valor más probable dentro de ese intervalo usando la fórmula de Czuber.
Ejemplo resuelto — Moda de alturas
Ejemplo completo — Las tres medidas con una tabla nueva
A continuación se resuelven las tres medidas sobre un conjunto de datos distinto, siguiendo el proceso completo desde la construcción de la tabla hasta la interpretación final.
Se añaden todas las columnas necesarias: marca de clase, frecuencia acumulada y producto para la media.
| Intervalo | \(x_i\) | \(f_i\) | \(F_i\) | \(f_i \cdot x_i\) |
|---|---|---|---|---|
| [0, 20) | \(\frac{0+20}{2}=10\) | 6 | 6 | \(6\times10=60\) |
| [20, 40) | \(\frac{20+40}{2}=30\) | 14 | 20 | \(14\times30=420\) |
| [40, 60) | \(\frac{40+60}{2}=50\) | 22 | 42 | \(22\times50=1.100\) |
| [60, 80) | \(\frac{60+80}{2}=70\) | 12 | 54 | \(12\times70=840\) |
| [80, 100] | \(\frac{80+100}{2}=90\) | 6 | 60 | \(6\times90=540\) |
| Totales | — | 60 | — | 2.960 |
Datos para la fórmula: \(L_m = 40\), \(a = 20\), \(F_{m-1} = F_2 = 20\), \(f_m = 22\)
\(d_1 = 22 – 14 = 8\) · \(d_2 = 22 – 12 = 10\)
Ejemplo adicional — Varianza y desviación típica para datos agrupados
Se añade la columna de desviaciones al cuadrado ponderadas por la frecuencia. El valor de \(\bar{x}\) se redondea a 49,33 para simplificar.
| \(x_i\) | \(f_i\) | \(x_i – \bar{x}\) | \((x_i-\bar{x})^2\) | \(f_i(x_i-\bar{x})^2\) |
|---|---|---|---|---|
| 10 | 6 | \(10-49{,}33=-39{,}33\) | \(1.546{,}8\) | \(9.280{,}9\) |
| 30 | 14 | \(30-49{,}33=-19{,}33\) | \(373{,}6\) | \(5.230{,}8\) |
| 50 | 22 | \(50-49{,}33=0{,}67\) | \(0{,}45\) | \(9{,}87\) |
| 70 | 12 | \(70-49{,}33=20{,}67\) | \(427{,}3\) | \(5.127{,}3\) |
| 90 | 6 | \(90-49{,}33=40{,}67\) | \(1.654{,}0\) | \(9.924{,}0\) |
| Totales | 60 | — | — | 29.572{,}9 |
Resumen — Fórmulas para datos agrupados
Errores comunes
\(\bar{x} = \sum f_i \cdot L_i / n\)
\(x_i = (40+60)/2 = 50\)
(sin restar \(f_m\))
\(d_2 = f_m – f_{m+1}\)
Preguntas frecuentes
Siempre es una aproximación. Al agrupar los datos en intervalos, se pierde la información exacta de cada valor individual. Al usar la marca de clase como representante, se asume que todos los datos del intervalo están en su punto medio, lo cual raramente es exacto.
La imprecisión es mayor cuando los intervalos son más anchos. Con intervalos más estrechos (más grupos), la aproximación mejora.
Las fórmulas siguen funcionando exactamente igual. La amplitud \(a\) puede ser diferente en cada intervalo; simplemente hay que usar la amplitud del intervalo correspondiente en cada cálculo.
Para la media: no afecta, porque la marca de clase se calcula individualmente para cada intervalo con su propia amplitud.
Para la mediana: se usa la amplitud \(a\) del intervalo mediano en concreto.
Para la moda: se usa la amplitud \(a\) del intervalo modal. Los intervalos con mayor amplitud tienden a tener más frecuencia, por lo que a veces conviene usar la densidad de frecuencia (\(f_i / a_i\)) para identificar el verdadero intervalo modal.
Sí, pero con una adaptación. La fórmula de Czuber necesita un intervalo anterior y uno posterior al intervalo modal. Si el intervalo modal es el primero de la tabla, no hay intervalo anterior, por lo que se asume que \(f_0 = 0\) (frecuencia nula antes del primer intervalo). De la misma forma, si el modal es el último, \(f_{k+1} = 0\).
En esos casos:
Si el primer intervalo es el modal: \(d_1 = f_m – 0 = f_m\)
Si el último intervalo es el modal: \(d_2 = f_m – 0 = f_m\)
Porque cada fórmula aplica una lógica diferente dentro de los mismos datos:
La media usa todos los datos con su frecuencia y la marca de clase: es un promedio ponderado global.
La mediana usa la interpolación dentro del intervalo donde cae la mitad de los datos: busca el «corte» central de la distribución.
La moda solo mira el intervalo de mayor frecuencia y cómo «sube» y «baja» la frecuencia alrededor de él: busca el punto de máxima concentración.
No hay una regla fija, pero existen varias sugerencias prácticas:
Regla de Sturges: el número de intervalos \(k\) recomendado es \(k = 1 + 3{,}322 \cdot \log_{10}(n)\), donde n es el número de datos.
Para 40 datos: \(k \approx 1 + 3{,}322 \times \log_{10}(40) \approx 1 + 3{,}322 \times 1{,}60 \approx 6{,}3 \approx 6\) intervalos.
Regla práctica: entre 5 y 15 intervalos suele dar una buena representación. Menos de 5 pierde demasiado detalle; más de 15 resulta difícil de interpretar.





