Páginas

martes, 24 de mayo de 2016

T.8: SESIONES TEÓRICAS ESTADÍSTICA Y TIC:
 "Medidas de tendencia central, posición y dispersión."


Buenas noches mis panas, seguimos con nuestra querida estadística con la explicación de unos métodos que no conllevan dificultad.

Comenzaremos por la media, moda, mediana...

MEDIDAS DE TENDENCIA CENTRAL

-Media aritmética: Suma de todos los valores de la variable observada entre el total de observaciones. Fórmula: x= Ʃx/n     Ej: para 9,5 y 4, la media es 6: (9+5+4)/3=6

-Mediana: medida de posición y central.
     Si el número de observaciones es impar  el valor de la observación será justamente la observación que ocupa la posición (n+1/2) Ejemplo: si son 75, pues 76 entre 2 = 38, la mediana seria la edad que tiene el sujeto 38.
     Si el número de observaciones es par, el valor de la mediana corresponde a la media entre los dos valores centrales, es decir, la media entre la observación n/2 y la observación (n/2)+1.

-Propiedad: Robustez

-Moda: Es el valor que más se repite.

MEDIDAS DE POSICIÓN O CUANTILES
Se calculan para variables cuantitativas.

-Percentiles: Dividen la muestra ordenada en 100 partes.
-Deciles: Dividen la muestra ordenada en 10 partes.
-Cuartiles: Dividen la muestra ordenada en 4 partes.


Ejercicio de clase: 


PESOS EN KG. DE NIÑOS ATENDIDOS EN LA CONSULTA DE NIÑO SANO n = 40
3,3
3,3
3,7
3,9
3,9
3,9
4,0
4,1
4,2
4,2
4,3
4,3
4,3
4,3
4,4
4,4
4,5
4,5
4,5
4,5
4,7
4,7
4,7
4,7
4,8
4,8
4,9
5,0
5,0
5,1
5,1
5,3
5,3
5,4
5,6
5,8
5,8
6,0
6,1
6,1

-          x= 4,685
-          Mo=4´3, 4´5, 4´7. Multimodal.
-          Me= 4,5+4,7/2=4,6. (Cuento el número 20 y lo sumo con el siguiente).

-          Q1= 4,2 
-          Q2=4,6 (el valor de la mediana), aunque si digo que es 4,5 también está bien).
-          Q3=5,1
-          Q4=6,1
Deciles:
D1=3,9                  D2=4,2                  D3=4,3                 
Peso en Kg
Fi
Fi
hi
Hi
[3,25-3,75)
Mc=3,5
3
3
0,075
0,075
[3,75- 4,25)
Mc=4,0
8
11
0,2
0,275
[4,25- 4,75)
Mc=4,5
14
25
0,35
0,625
[4,75-5,25)
Mc=5,0
6
31
0,15
0,775
[5,25-5,75)
Mc=5,5
4
35
0,1
0,875
[5,75-6,25)
Mc=6,0
5
40
0,125
1

                              N=40

En este caso usaríamos las Mc para calcular las medidas de tendencia central (porque sabemos que hay tres niños en el primer intervalo pero no sabemos cuánto pesa exactamente cada niño).
x= ƩM
Me= [4,25-4,75)
Mo= [4,25-4,75)
hi/a = Se hace para cuando no todos tienen la misma amplitud.
a=amplitud = 0,5 (3,75-4,25): Se haría en todos. 

MEDIDAS DE DISPERSIÓN


La información aportada por las medidas de tendencia central es limitada.
Ejemplo:
-          Serie 1: 18,19,20,21,22.
-          Mediana serie 1=20, Media serie 1=20
-          Serie 2: 9,14,20,27,30.
-          Mediana serie 2=20, Media serie 2=20
¿Qué es lo que diferencia a una de otra? La dispersión.

·         Rango o recorrido: Diferencia entre el mayor y el menor valor de la muestra lXn-X1l (valor absoluto).

Según el ejemplo anterior:
-          R1=22-18=4
-          R2=30-9=21 (esto ya nos indica que la serie 2 tiene más dispersión).

·         Desviación media: Media aritmética de las distancias de cada observación con respecto a la media de la muestra:


·         Desviación típica o estándar: Cuantifica el error que cometemos si representamos una muestra únicamente por su media.  Esta es la que más se emplea debido a que esta nos da un mayor rango de error. 

Resultado de imagen de desviación típica

·         Varianza: Expresa la misma información en valores cuadráticos:

·         Recorrido intercuartílico: Diferencia entre el tercer y el primer cuartil = lQ3-Q1l


·         Coeficiente de variación: Es una medida de dispersión relativa (adimensional) ya que todas las demás se expresan en la unidad de medida de la variable. Nos sirve para comparar la heterogeneidad de dos series numéricas con independencia de las unidades de medidas. Se expresa sin unidades. 


DISTRIBUCIONES NORMALES

Las distribuciones normales en un histograma aparece una especie de Campana, por eso la campana de Gauss. Y es simétrica respecto de los valores de posición central, es decir que la moda va a coincidir con la media y la mediana.

Media, moda, mediana.
La gráfica de su función de densidad tiene una forma acampanada y es simétrica respecto de los valores posición central (media, mediana y moda, que coinciden en estas distribuciones). Es simetrica dejando la mitad de los valores por debajo del punto maximo y la mitad de los valores por encima. 

ASIMETRÍAS Y CURTOSIS






La asimetría es al lado contrario al que vemos el pico (la moda), es decir si vemos el pico hacia la derecha la asimetría es a la izquierda, y si la moda esta a la izquierda la asimetría esta hacia la derecha.

·         Coeficiente de asimetría de una variable: Grado de asimetría de la distribución de sus datos en torno a su media, cuanto más asimétrica sea, valores más diferentes encontraremos.

·         Asimetrías:

Los resultados pueden ser los siguientes:
-          g1=0 (distribución simétrica; existe la misma concentración de valores a la derecha y a la izquierda de la media).
-          g1>0 (distribución asimétrica positiva; existe mayor concentración de valores  a la derecha de la media que a su izquierda).
-          g1<0 (distribución asimétrica negativa; existe mayor concentración de valores a la izquierda de la media que a su derecha).

·         Curtosis o apuntamiento de la curva.

No tiene relación con la simetría. Coeficiente de apuntamiento o curtosis de una variable, sirve para medir el grado de concentración de los valores que toma en torno a su media. Los datos se acumulan mucho, mientras mas se acumulen, mas apuntada esta la curva.
Se elige como referencia una variable con distribución normal, de modo que para ella el coeficiente de curtosis es 0.

Los resultados pueden ser los siguientes:
-          g2=0 (distribución mesocúrtica o normal). Presenta un grado de concentración medio alrededor de los valores centrales de la variable (el mismo que presenta una distribución normal).
-          g2>0 (distribución leptocúrtica). Presenta un elevado grado de concentración alrededor de los valores centrales de la variable.

-          g2<0 (distribución platicúrtica). Presenta un reducido grado de concentración alrededor de los valores centrales de la variable.

TIPICACIÓN DE LOS VALORES Y SU RELACION CON LA CAMPANA DE GAUSS

La tipificación nos permite conocer si valor corresponde o no a esa distribución con frecuencia.


Finish por hoy, Salu2!

1 comentario: