La desviación estándar es un indicador en extremo valioso con muchas aplicaciones. Por ejemplo, los estadísticos saben que cuando un conjunto de datos se distribuye de manera “normal”, el 68% de las observaciones de la distribución tiene un valor que se encuentra a menos de una desviación estándar de la media. También saben que el 96% de todas las observaciones tiene un valor no es mayor a la media más o menos dos desviaciones estándar (la Figura 18 grafica esta información).


La desviación estándar de una población es normalmente representada por la letra griega (sigma), cuando se calcula sobre la base de toda la población; por la letra s (minúscula) cuando se infiere de una muestra; y por la letra S (mayúscula) cuando simplemente corresponde a la desviación estándar de una muestra. La fórmula de la desviación estándar es:

donde

representa la suma de las diferencias al cuadrado entre cada observación y la media y N representa el número total de observaciones. La aparente complicación de la fórmula surge del hecho de que al restar la media a los valores de cada observación individual para calcular las diferencias ( ), los valores de las observaciones que están bajo la media producirán diferencias negativas, mientras que los valores de las observaciones que son mayores que la media proporcionarán valores positivos. Así, las diferencias positivas y negativas se compensarán entre sí y, en el caso de una distribución simétrica, producirán una suma igual a cero para la suma de las desviaciones individuales. Para evitar este problema, las desviaciones se elevan al cuadrado, de modo que todas las desviaciones sean positivas y se puedan sumar. Después, se calcula la raíz cuadrada para ‘compensar’, por decirlo así, la elevación al cuadrado anterior de los valores. Cuando no se incluye la raíz cuadrada, el resultado es otro famoso indicador de dispersión conocido como la “varianza”.

Tema 2

Tu Progreso

60%

Progreso General del Curso