Medidas de tendencia central
Las medidas de tendencia central son valores que representan o resumen un conjunto de datos, indicando el punto central o típico en una distribución. Las tres medidas de tendencia central más comunes son la media, la mediana y la moda.
Media
La media aritmética es el promedio de un conjunto de valores. Se calcula sumando todos los valores y dividiendo el resultado por la cantidad de valores.
Para un conjunto de datos , la fórmula de la media es:
donde:
- es la media aritmética.
- representa cada valor del conjunto de datos.
- es el número total de valores.
Mediana
La mediana es el valor que se encuentra en el centro de un conjunto de datos ordenados de menor a mayor. Si el número de valores es impar, la mediana es el valor central. Si es par, la mediana es el promedio de los dos valores centrales.
- Para un conjunto de datos impar:
- Para un conjunto de datos par:
donde representa el -ésimo valor del conjunto de datos ordenado.
Moda
La moda es el valor o los valores que ocurren con mayor frecuencia en un conjunto de datos. Un conjunto de datos puede tener una moda (unimodal), dos modas (bimodal), o más modas (multimodal). Si todos los valores ocurren con la misma frecuencia, no hay moda.
Comparación y Usos
- Media: Es sensible a los valores extremos (outliers), por lo que en distribuciones con outliers puede no representar adecuadamente el centro de la distribución.
- Mediana: No se ve afectada por valores extremos y es una mejor medida de tendencia central para distribuciones sesgadas.
- Moda: Es útil para datos categóricos donde queremos saber cuál es la categoría más común. También puede ser útil en datos numéricos para identificar la concentración de valores.
Ejemplos
Supongamos que tenemos el siguiente conjunto de datos: .
- Media:
- Mediana:
Ordenamos los datos (ya están ordenados): . La mediana es el valor central, en este caso, .
- Moda:
El valor que más se repite es .
Conclusión
Las medidas de tendencia central son herramientas fundamentales en estadística descriptiva, ya que proporcionan un resumen numérico que describe el punto central de un conjunto de datos. Cada medida tiene sus propias ventajas y desventajas, y la elección de cuál utilizar depende de la naturaleza y la distribución de los datos analizados.