sábado, 30 de mayo de 2015

Tema 8. Medidas de tendencia central, posición y dispersión.

En este tema comenzamos diferenciando los 3 tipos de medidas. Al principio me lió un poco porque el profesor tenía en sus diapositivas una cosa y él explicaba otra, al final me quedé con lo que él explicaba que espero que sea lo correcto:


  • Medidas de tendencia central: informan del comportamiento central de los sujetos.
  • Medidas de posición: informan de la posición de un sujeto de una determinada observación.
  • Medidas de dispersión: informan de la heterogeneidad de las observaciones.

Ahora pasamos a ver dentro de cada una de esas medidas cuales había.

Medidas de tendencia central

Media aritmética o media

Es la suma de todos los valores de la variable observada entre el total de observaciones, es decir, la suma de todos los datos  de la variable entre el número total de sujetos.


Se puede medir tanto para datos no agrupados: 

Como para datos agrupados:
  


Mediana (Me)

Es el valor de la observación tal que un 50% de los datos es menor y otro 50% es mayor, es decir, es el valor que deja la mitad de datos por debajo y la mitad por arriba. Si hay un número impar de datos, el valor de la mediana será justo el que está en el centro, y si es par, el valor será el que dé al sumar los dos centrales dividido entre 2.

Moda (Mo)

Es el valor con mayor frecuencia, es decir, el valor que más se repite. Si hay más de una la muestra será bimodal (dos modas) o multimodal (más de dos modas). Y si los datos son agrupados se hablará de clase modal y será el intervalo (intervalo modal) en el que hi/amplitud sea mayor.

Medidas de posición

Estas medidas son los cuantiles, que se calculan para variables cuantitativas; y pueden ser:

Percentiles (P)

Dividen la muestra en 100 partes y el Pi es el valor en el que i% de las observaciones son menores que él y el (100-i)% son mayores. El valor P50 corresponde al de la mediana.

Deciles (D)

Dividen la muestra en 10 partes y el Di es el valor en el que i/10% de las observaciones son menores que él y el 100-i/10% son mayores. El valor D5 corresponde al valor de la mediana y, por lo tanto, al del P50.

Cuartiles (Q)

Dividen la muestra en 4 partes: Q1 (25% de las observaciones menores y 75% mayores), Q2 (50% de la observaciones menores y 50% mayores; coincide con el valor de D5 y P50), Q3 (75% de las observaciones y 25% mayores) y Q4 (valor mayor que se alcanza).
  

Estas medidas ahora con un ejemplo se entenderán mejor

Pesos en kg. de niños atendidos en la consulta de niño sano n = 40



X=(3,3+3,3+3,7+3,9+3,9+3,9+4+4,2+4,2+4,3+4,3+4,3+4,3+4,4+4,4+4,5+4,5+4,5+4,5+4,7+4,7+4,7+4,7+4,8+4,8+4,9+5+5+5,1+5,1+5,3+5,3+5,4+5,6+5,8+5,8+6+6,1+6,1)/40 = 4,685

Mo = 4’3, 4’5 y 4’7 (es multimodal)

Me = (4’5+4’7)/2 = 4,6 (se realiza esta operación dado que n es par)

Un par de ejemplos de percentiles: P50 = 4,5 (también es válido el valor de la mediana), P80 = 5,3

Deciles: D1 = 3,9, D2 = 4,2, D3 = 4,3…

Cuartiles: Q1 = 4,2, Q2 = 4,5 (también vale el valor de la mediana), Q3 = 5,1 y Q4 = 6,1



Medidas de dispersión

Rango o recorrido

Diferencia entre el mayor y el menor valor de la muestra. 


Desviación media

Media aritmética de las distancias de cada observación con respecto a la media de la muestra.
 

Y para datos agrupados.

Desviación típica

Cuantifica el error que cometemos si representamos una muestra únicamente por su media.

Y también para datos agrupados.



Varianza

Expresa la misma información que la desviación típica en valores cuadráticos.

 
Y para datos agrupados.



Recorrido intercuartílico

Diferencia entre el tercer cuartil y el primer cuartil.



Coeficiente de variación

Es una medida de dispersión relativa (adimensional) ya que todas las demás se expresan en la unidad de medida de la variable. Nos sirve para comparar la heterogeneidad de dos series numéricas con independencia de las unidades de medidas.



Aquí dejo un ejemplo:

Unas enfermeras han registrado en el punto de vacunación las edades de nueve niños que han sido vacunados durante una sesión, obteniéndose los siguientes datos: 3, 2, 4, 2, 1, 3, 5, 3 y 4 meses.

   
Por último, en este tema hablamos de la distribución normal y de la curtosis y asimetrías.

Distribución normal

En estadística se llama distribución normal, distribución de Gauss o distribución gaussiana, a una de las distribuciones de probabilidad de variable continua que con más frecuencia aparece en fenómenos reales.

La gráfica de su función de densidad tiene una forma acampanada y es simétrica respecto de los valores posición central (media, mediana y moda, que coinciden en estas distribuciones).

Una distribución normal sigue estos principios básicos:
            ± 1S     68% de las observaciones.
            ± 2S     95% de las observaciones.
            ± 3S     99% de las observaciones.


 
Asimetrías

Los tipos de asimetrías aparecen en la siguiente imagen y según los valores que den será:




  • g1=0 (distribución simétrica; existe la misma concentración de valores a la derecha y a la izquierda de la media).
  • g1>0 (distribución asimétrica positiva; existe mayor concentración de valores  a la derecha de la media que a su izquierda).
  • g1 <0 (distribución asimétrica negativa; existe mayor concentración de valores a la izquierda de la media que a su derecha). 




Curtosis

Al igual que en la asimetría, en la siguiente imagen se ven los tipos de curtosis (solo en gráficas simétricas) y según los valores que den serán:
 
  • g2=0 (distribución mesocúrtica). Presenta un grado de concentración medio alrededor de los valores centrales de la variable (el mismo que presenta una distribución normal). 
  • g2>0 (distribución leptocúrtica). Presenta un elevado grado de concentración alrededor de los valores centrales de la variable.
  • g2<0 (distribución platicúrtica). Presenta un reducido grado de concentración alrededor de los valores centrales de la variable.
 


Sobre este tema, la única dificultad que veo es no confundir las fórmulas y tener muy claros los conceptos. También en las asimetrías que puede llegar a ser lioso, como ocurrió en clase que varias personas empezaron a confundirse, y que en el examen aparezca alguna gráfica que no te de ningún valor y que no esté bien definida como leptocúrtica, mesocúrtica o platicúrtica.


Duda: ¿para qué nos sirve que nos diga para que valores es cada tipo de asimetría y de curtosis si no hemos dado la fórmula?
 

No hay comentarios:

Publicar un comentario