Comparación de las Medidas de Tendencia Central

Las ventajas y limitaciones de usar la media, la moda y la mediana para describir un conjunto de datos depende estrictamente de la forma (tipo) de la distribución de datos. Siempre que se pueda usar, en general se prefiere la media para describir la tendencia central, aunque algunas distribuciones se describen mejor por medio de la moda y la mediana. A continuación evaluaremos la aplicabilidad de nuestros tres ‘promedios’ a diferentes tipos de distribuciones.

(1) En una distribución normal, la media, moda y mediana tienen un valor idéntico (Figura 15). Esto en realidad es evidente, dado que una distribución normal es perfectamente simétrica, y la curva tiene un sólo punto máximo (moda) que también se encuentra en el centro. Así, la media debe ser nuestra medida preferida de tendencia central para los conjuntos de datos que se distribuyen normalmente, puesto que es más fácil de calcular y de usar en forma matemática.

(2) Una distribución bimodal tiene dos puntos máximos (Figura 15). Esto hace que la media y la mediana no sean de utilidad, puesto que sus valores estarán en algún lugar entre los dos puntos máximos y distorsionarán enormemente la descripción de la distribución. La moda, y observe que en este caso hay dos modas, pasa a ser la única medida útil de tendencia central. Sin embargo, una distribución bimodal es poco común y en general podemos decir que consta de dos distribuciones que se pueden analizar en forma independiente.

(3) Cuando se describen distribuciones asimétricas (sesgadas) positivas o negativas, la media no es la mejor medida de tendencia central disponible. Mientras mayor sea la asimetría o sesgo de los datos, mayor utilidad tendrá la mediana (y más engañosa será la media), porque la mediana estará más cerca del ‘valor promedio’ real de las observaciones. Por ejemplo, en el caso de una distribución asimétrica positiva, la media se encuentra ‘inflada’ por la minoría de las observaciones que tienen un valor mayor. Esto sucede, por ejemplo, con el ingreso per cápita, puesto que las distribuciones del ingreso son asimétricas positivas. En las siguientes figuras se muestran las posiciones relativas de la media, la moda y la mediana en cuatro distribuciones asimétricas.

Observe que cuando la distribución es asimétrica ‘positiva’, (es decir, el extremo más largo de la distribución apunta hacia el este o hacia su derecha), la moda está a la izquierda de la mediana, y a su vez, la mediana está a la izquierda del promedio. Sucede lo contrario cuando la distribución es asimétrica negativa o sesgada negativamente. Esto nos lleva a una consideración final: si una distribución es asimétrica, es decir, notoriamente sesgada, la mediana será mejor que la media (promedio aritmético) para describir la tendencia central de la distribución de los datos. Observe las figuras anteriores. Note que en todas las distribuciones asimétricas, la mediana efectivamente se acerca más que la media al valor ‘promedio o ‘normal’ de las observaciones o, en otras palabras, refleja mejor la existencia de un sesgo en los datos.