miércoles, 16 de abril de 2014

Como graficar una Campana de Gauss

Hace un par de semanas en una capacitación de Excel, me preguntaron como crear una Campana de Gauss, y aunque le di la respuesta en ese momento, no tuve tiempo de publicarlo en el blog.
Sin embargo, ahora ya con un poco mas de tiempo, estoy poniéndome al día con todas la publicaciones que tengo pendiente y así colocar al alcance de todos esta herramienta que es muy buena.

Campana de Gauss es el nombre informal que le damos a la representación gráfica de una distribución normal de un conjunto de datos. Pero surge una pregunta de natural y espontanea, desde lo profundo de nuestra realidad óntica, inalienable que no permuta a través del tiempo (estoy profundo, jajaja)... ¿Qué es una distribución normal?

La distribución normal

Cuando medimos cierto atributo de un grupo de personas u objetos que nos rodean y los analizamos, es muy común obtener una distribución normal en los resultados, es decir, la mayoría de los valores estarán cercanos al promedio mientras que una menor cantidad de valores estarán ubicados en los extremos.
Por ejemplo, si medimos la estatura de un grupo de personas y graficamos los resultados obtendremos una distribución normal ya que la mayoría tendrá una estatura promedio pero también encontraremos algunas personas de menor o mayor estatura.

La distribución normal también es conocida como distribución de Gauss y la forma de la curva del gráfico se asemeja a una campana, este tipo de gráfico se conoce como Campana de Gauss.

Para crear una Campana de Gauss, requerimos conocer 3 funciones:
- La función PROMEDIO
- La función DESVESTA (desviación estándar)
- La función DISTR.NORM.N (Distribución Normal N)

Promedio y desviación estándar

La mayoría de los valores en una distribución normal se ubicará muy cerca del promedio por lo que es importante obtener la media de esos valores utilizando la función PROMEDIO. El uso de esta función es muy sencillo, solamente debemos colocar el rango de datos y obtendremos el resultado correcto:

=PROMEDIO(A2:D2)

La desviación estándar mide la cercanía de cada uno de los valores respecto al promedio. Entre más alejados del promedio se encuentren los valores, mayor será la desviación estándar. Por ejemplo, en la siguiente imagen puedes notar varios conjuntos de datos cuyo promedio es siempre el mismo pero la desviación estándar es diferente:


Como observamos todos los grupos tienen el mismo Promedio, pero diferente Desviación Estándar; ya que algunos valores son mas altos que otros.

En el primer grupo los valores son cercanos al promedio, es por ello que la desviación estándar es menor al tercer grupo donde los valores son mas lejanos al promedio.

Creación de una Campana de Gauss

Vamos a crear una Campana de Gauss de un conjunto de notas de la Universidad. Contamos con una lista de 400 notas de los alumnos y lo primero que debemos hallar es el Promedio y de la Desviación Estándar de estas notas.


Para ambas funciones utilizamos el rango de A2:A401. Tanto la función PROMEDIO, como la función DESVESTA, las encontramos en el grupo de funciones Estadísticas.


Ahora debemos obtener una lista única y ordenada de las distintas notas que tenemos, sin tener datos repetidos. Para ello les recomiendo que visiten las publicaciones de Como ordenar una lista de datos y  de Como quitar duplicados en una lista de datos.

Entonces procedo a copiar la lista de notas en la celda D4, luego los ordeno de menor a mayor y quito los duplicados, para quedarme solo con los valores únicos.


Ahora utilizaremos la función DISTR.NORM.N para calcular la distribución normal, teniendo ya la media y la desviación estándar.

=DISTR.NORM.N(D5;$D$1;$D$2;FALSO)

Esta función nos devuelve la distribución normal para un valor dadas la media y la desviación estándar como segundo y tercer argumento respectivamente. En la fórmula he colocado ambos argumentos como referencias absolutas para que se mantengan fijas al copiar la fórmula hacia abajo. El último argumento de la función indica si deseamos utilizar la función de distribución acumulativa y que para nuestro ejemplo colocaremos el valor falso. Observa el resultado obtenido al copiar esta fórmula en la columna E:


Ahora debemos insertar el gráfico y para ello me posiciono en cualquier celda del rango D4:E37 y presionamos la etiqueta Insertar > Gráficos > Dispersión > Dispersión con líneas suavizadas


Obtenemos el siguiente resultado:

Seleccionamos la Leyenda (la palabra Distribución que encontramos a la derecha del gráfico) y lo suprimo (Su primo = hijo de su tía, ... mal chiste).
Luego vamos a hacer clic derecho en los números del eje horizontal (eje inferior)  y seleccionamos Dar formato a eje (por ejemplo clic derecho en el 120) y colocamos los siguientes valores:


Finalmente obtenemos nuestra Campana de Gauss:


Cualquier consulta, no dude en indicármela y con gusto la atenderé.

Ing. Enrique Neciosup Morales
enrique@expertosenexcelpc.com 
Síguenos en Facebook