En
este tema comenzamos diferenciando los 3 tipos de medidas. Al principio me lió
un poco porque el profesor tenía en sus diapositivas una cosa y él explicaba
otra, al final me quedé con lo que él explicaba que espero que sea lo correcto:
- Medidas de tendencia central: informan del comportamiento central de los sujetos.
- Medidas de posición: informan de la posición de un sujeto de una determinada observación.
- Medidas de dispersión: informan de la heterogeneidad de las observaciones.
Ahora
pasamos a ver dentro de cada una de esas medidas cuales había.
Medidas de tendencia central
Es
la suma de todos los valores de la variable observada entre el total de
observaciones, es decir, la suma de todos los datos de la variable entre el número total de sujetos.
Se
puede medir tanto para datos no agrupados:
Como
para datos agrupados:
Mediana (Me)
Es
el valor de la observación tal que un 50% de los datos es menor y otro 50% es
mayor, es decir, es el valor que deja la mitad de datos por debajo y la mitad
por arriba. Si hay un número impar de datos, el valor de la mediana será justo
el que está en el centro, y si es par, el valor será el que dé al sumar los dos
centrales dividido entre 2.
Moda (Mo)
Es
el valor con mayor frecuencia, es decir, el valor que más se repite. Si hay más
de una la muestra será bimodal (dos modas) o multimodal (más de dos modas). Y
si los datos son agrupados se hablará de clase modal y será el intervalo
(intervalo modal) en el que hi/amplitud sea mayor.
Medidas de posición
Estas
medidas son los cuantiles, que se calculan para variables cuantitativas; y
pueden ser:
Percentiles (P)
Dividen
la muestra en 100 partes y el Pi es el valor en el que i% de las
observaciones son menores que él y el (100-i)% son mayores. El valor P50
corresponde al de la mediana.
Deciles (D)
Dividen
la muestra en 10 partes y el Di es el valor en el que i/10% de las
observaciones son menores que él y el 100-i/10% son mayores. El valor D5
corresponde al valor de la mediana y, por lo tanto, al del P50.
Cuartiles (Q)
Dividen
la muestra en 4 partes: Q1 (25% de las observaciones menores y 75%
mayores), Q2 (50% de la observaciones menores y 50% mayores;
coincide con el valor de D5 y P50), Q3 (75% de
las observaciones y 25% mayores) y Q4 (valor mayor que se alcanza).
Estas
medidas ahora con un ejemplo se entenderán mejor
Pesos
en kg. de niños atendidos en la consulta de niño sano n = 40
X=(3,3+3,3+3,7+3,9+3,9+3,9+4+4,2+4,2+4,3+4,3+4,3+4,3+4,4+4,4+4,5+4,5+4,5+4,5+4,7+4,7+4,7+4,7+4,8+4,8+4,9+5+5+5,1+5,1+5,3+5,3+5,4+5,6+5,8+5,8+6+6,1+6,1)/40
= 4,685
Mo
= 4’3, 4’5 y 4’7 (es multimodal)
Me
= (4’5+4’7)/2 = 4,6 (se realiza esta operación dado que n es par)
Un
par de ejemplos de percentiles: P50 = 4,5 (también es válido el
valor de la mediana), P80 = 5,3
Deciles:
D1 = 3,9, D2 = 4,2, D3 = 4,3…
Cuartiles:
Q1 = 4,2, Q2 = 4,5 (también vale el valor de la mediana),
Q3 = 5,1 y Q4 = 6,1
Medidas de dispersión
Rango o recorrido
Desviación media
Media
aritmética de las distancias de cada observación con respecto a la media de la
muestra.
Y
para datos agrupados.
Desviación típica
Cuantifica
el error que cometemos si representamos una muestra únicamente por su media.
Y
también para datos agrupados.
Varianza
Expresa
la misma información que la desviación típica en valores cuadráticos.
Y
para datos agrupados.
Recorrido intercuartílico
Diferencia
entre el tercer cuartil y el primer cuartil.
Coeficiente de variación
Aquí
dejo un ejemplo:
Por
último, en este tema hablamos de la distribución normal y de la curtosis y asimetrías.
Distribución normal
En
estadística se llama distribución normal, distribución de Gauss o distribución
gaussiana, a una de las distribuciones de probabilidad de variable continua que
con más frecuencia aparece en fenómenos reales.
La
gráfica de su función de densidad tiene una forma acampanada y es simétrica
respecto de los valores posición central (media, mediana y moda, que coinciden
en estas distribuciones).
Una
distribución normal sigue estos principios básicos:
± 1S 68%
de las observaciones.
± 2S 95% de las observaciones.
± 3S 99% de las observaciones.
Asimetrías
Los
tipos de asimetrías aparecen en la siguiente imagen y según los valores que den
será:
- g1=0 (distribución simétrica; existe la misma concentración de valores a la derecha y a la izquierda de la media).
- g1>0 (distribución asimétrica positiva; existe mayor concentración de valores a la derecha de la media que a su izquierda).
- g1 <0 (distribución asimétrica negativa; existe mayor concentración de valores a la izquierda de la media que a su derecha).
Curtosis
- g2=0 (distribución mesocúrtica). Presenta un grado de concentración medio alrededor de los valores centrales de la variable (el mismo que presenta una distribución normal).
- g2>0 (distribución leptocúrtica). Presenta un elevado grado de concentración alrededor de los valores centrales de la variable.
- g2<0 (distribución platicúrtica). Presenta un reducido grado de concentración alrededor de los valores centrales de la variable.
Sobre
este tema, la única dificultad que veo es no confundir las fórmulas y tener muy
claros los conceptos. También en las asimetrías que puede llegar a ser lioso,
como ocurrió en clase que varias personas empezaron a confundirse, y que en el
examen aparezca alguna gráfica que no te de ningún valor y que no esté bien
definida como leptocúrtica, mesocúrtica o platicúrtica.
Duda:
¿para qué nos sirve que nos diga para que valores es cada tipo de asimetría y
de curtosis si no hemos dado la fórmula?
















No hay comentarios:
Publicar un comentario