La estadística permite estimar algunas características propias de ciertas muestras de poblaciones, a través de la observación detenida de la distribución de frecuencias y de las gráficas de barras y lineal correspondientes.
La moda de una distribución está ubicada en el intervalo de mayor frecuencia y corresponde, en el histograma, a algún valor entre los extremos de la base de la barra de mayor altura; la marca de clase de tal intervalo es una estimación de la moda. Si se desea una mejor estimación se ubica en el semi-intervalo que queda al lado de la base de la clase contigua con mayor frecuencia.
Si \(n\) es la cantidad de elementos de la muestra, la mediana se encuentra en la clase mediana, cuya frecuencia acumuleda anterior es menor que \(\frac{n}{2}\) y cuya frecuencia acumuladasiguiente es mayor que \(\frac{n}{2}\). En las gráficas lineales de frecuencias acumuladas es el valor de la abcisa , que corresponde a una frecuencia absoluta acumulada \(\frac{n}{2}\) o una frecuencia relativa acumulada 50%.
La media aritmética generalmente es un valor muy cercano a los de la clase que contiene la moda; algunas veces tal clase no es representativa de la muestra o población y, en ese caso, le madia se desplaza hacia los intervalos que tengan mayor frecuencia.
Ejemplo:
La siguiente tabla muestra cómo se encuentran distribuidas las edades de los alumnos de grado 8°. Contruyamos el histograma y los diagramas necesarios para estimar la moda, la mediana y la media de la edad de los alumnos.
Distribución de frecuencias absolutas de las edades de 50 estudiantes de grado 8° de colegios de Bogotá
Edad en meses
Marca de clase \(X_i\)
Frecuencia absoluta: \(f_i\)
Frecuencia acumulada: \(F_i\)
145 - 154
149.5
5
155 - 164
159.5
25
30
165 - 174
169.5
18
48
175 - 184
179.5
2
50
De acuerdo con la tabla, la moda está en la clase 155 - 164, y como la frecuencia mayor de los intervalos anexos a la clase modal corresponde al intervalo de edades mayores, entonces la moda está entre la marca de clase 159.5 meses y 164.5 meses que es el extremo superior de la clase modal.
La mediana es la edad en meses del dato 25. Las frecuencias absolutas acumuladas informan que ese dato está después de la marca de clase de la mediana que es el intervalo 155 - 164. Luego la mediana es un valor entre 159.5 meses y 164.5 meses.
La media aritmética puede ser una edad en el intervalo 155 - 159, pero como hay 18 alumnos con edad mayor, es posible que esté desplazada hacia el extremo superior de ese intervalos.
PREGUNTA: De las medidas de tendencia central mencionadas en el texto anterior. ¿Cuál es la medida que menos se deja afectar por los valores de la base de datos?