lunes, 26 de octubre de 2009

Medidas de Tendencia Central y de Variabilidad

Escuela Preparatoria del Estado No. 3
Area de Fisicos-Matematicos, (5º "F") Matutino'!
Prof. Manuel Davila Ochoa, Estadistica


Integrantes:
•Fabián Alfonso Sánchez Velázquez
•Carmen Yadira Osorio Estrada

Unidad III ---> Medidas de Tendencia Central y Variabilidad



3.1 Las medidas de tendencia central corresponden a valores que generalmente se ubican en la parte central de un conjunto de datos. (Ellas permiten analizar los datos en torno a un valor central). Entre éstas están la media aritmética, la moda y la mediana.


a) Media aritmética
Es aquella medida que se obtiene al dividir la suma de todos los valores de una variable por la frecuencia total. En palabras más simples, corresponde a la suma de un conjunto de datos dividida por el número total de dichos datos


Ejemplo 1:
En matemáticas, un alumno tiene las siguientes notas: 4, 7, 7, 2, 5, 3
n = 6 (número total de datos )
X=4 + 7 + 7 + 2 + 5 + 3 =28/6 =4,8


b) Moda (Mo)

Es la medida que indica cual dato tiene la mayor frecuencia en un conjunto de datos, o sea, cual se repite más.
Ejemplo 1:
Determinar la moda en el siguiente conjunto de datos que corresponden a las edades de niñas de un Jardín Infantil.
5, 7, 3, 3, 7, 8, 3, 5, 9, 5, 3, 4, 3
La edad que más se repite es 3, por lo tanto, la Moda es 3 (Mo = 3)




c) Mediana (Med)
Es el valor central de un conjunto de valores ordenados en forma creciente o decreciente. Dicho en otras palabras, la Mediana corresponde al valor que deja igual número de valores antes y después de él en un conjunto de datos agrupados.
Según el número de valores que se tengan se pueden presentar dos casos:
- Si el número de valores es impar, la Mediana corresponderá al valor central de dicho conjunto de datos.
- Si el número de valores es par, la Mediana corresponderá al promedio de los dos valores centrales (los valores centrales se suman y se dividen por 2).



Ejemplo 1:
Se tienen los siguientes datos: 5, 4, 8, 10, 9, 1, 2
Al ordenarlos en forma creciente, es decir de menor a mayor, se tiene:
1, 2, 4, 5 , 8, 9, 10
El 5 corresponde a la Med, porque es el valor central en este conjunto de datos impares.



Ejemplo 2:



En el gráfico de barras (que tiene un número par de columnas) los valores centrales son 72 y 77, por lo tanto, la
Med = 72 + 77/2 =

Med = 149/2 = 74,5




3.1.1 DATOS NO AGRUPADOS


Otro modo habitual, y muy útil, de resumir una variable de tipo numérico es utilizando el concepto de percentiles, mediante diagramas de cajas. La Figura muestra un gráfico de cajas correspondiente a los datos de la Tabla I. La caja central indica el rango en el que se concentra el 50% central de los datos. Sus extremos son, por lo tanto, el 1er y 3er cuartil de la distribución. La línea central en la caja es la mediana. De este modo, si la variable es simétrica, dicha línea se encontrará en el centro de la caja. Los extremos de los "bigotes" que salen de la caja son los valores que delimitan el 95% central de los datos, aunque en ocasiones coinciden con los valores extremos de la distribución. Se suelen también representar aquellas observaciones que caen fuera de este rango (outliers o valores extremos). Esto resulta especialmente útil para comprobar, gráficamente, posibles errores en nuestros datos. En general, los diagramas de cajas resultan más apropiados para representar variables que presenten una gran desviación de la distribución normal.


usaremos los mismos datos para todas las graficas ;)!



Tabla I. Distribución de frecuenciasde la edad en 100 pacientes.

Edad, Nº de pacientes
18, 1
19, 3
20, 4
21, 7
22, 5
23, 8
24, 10
25, 8
26, 9
27, 6
28, 6
29, 4
30, 3
31, 4
32, 5
33, 3
34, 2
35, 3
36, 1
37, 2
38, 3
39, 1
41, 1
42, 1







3.1.2 DATOS AGRUPADOS



Histograma: Esta formado por rectángulos cuya base es la amplitud del intervalo y tiene la característica que la superficie que corresponde a las barras es representativa de la cantidad de casos o frecuencia de cada tramo de valores, puede construirse con clases que tienen el mismo tamaño o diferente ( intervalo variable). La utilización de los intervalos de amplitud variable se recomienda cuando en alguno de los intervalos , de amplitud constante, se presente la frecuencia cero o la frecuencia de alguno o algunos de los intervalos sea mucho mayor que la de los demás, logrando así que las observaciones se hallen mejor repartidas dentro del intervalo.






Ojivas: Cuando se trata de relacionar observaciones en un mismo aspecto para dos colectivos diferentes no es posible ejecutar comparaciones sobre la base de la frecuencia, es necesario tener una base estándar, la frecuencia relativa. La ojiva representa gráficamente la forma en que se acumulan los datos y permiten ver cuantas observaciones se hallan por arriba o debajo de ciertos valores. Es útil para obtener una medida de los cuartiles, deciles , percentiles.
Polígono de Frecuencias
Se puede obtener uniendo cada punto medio (marca de clase) de los rectángulos del histograma con líneas rectas, teniendo cuidado de agregar al inicio y al final marcas de clase adicionales, con el objeto de asegurar la igualdad del áreas.


Diagramas de barras son similares a los gráficos de sectores. Se representan tantas barras como categorías tiene la variable, de modo que la altura de cada una de ellas sea proporcional a la frecuencia o porcentaje de casos en cada clase . Estos mismos gráficos pueden utilizarse también para describir variables numéricas discretas que toman pocos valores.






En los gráficos de sectores, también conocidos como diagramas de "tartas", se divide un círculo en tantas porciones como clases tenga la variable, de modo que a cada clase le corresponde un arco de círculo proporcional a su frecuencia absoluta o relativa. Un ejemplo se muestra en la . Como se puede observar, la información que se debe mostrar en cada sector hace referencia al número de casos dentro de cada categoría y al porcentaje del total que estos representan. Si el número de categorías es excesivamente grande, la imagen proporcionada por el gráfico de sectores no es lo suficientemente clara y por lo tanto la situación ideal es cuando hay alrededor de tres categorías. En este caso se pueden apreciar con claridad dichos subgrupos.


Medidas de variabilidad
Las medidas de tendencia central por si solas no cuentan toda la historia.
Son indicadores del grado de dispersión de los datos.

Promedio versus variabilidad Población Datos Promedio A 9, 5, 6, 2, 3, 3 4.7 B 10, 7, 7, 1, 2, 1 4.7
Medidas de variabilidad

Es un número real y nunca es <0.
Si es 0 todos los datos son idénticos
Aumenta según los datos se hacen más diversos

Tipos de medidas

Rango o amplitud
Varianza
Desviación estándar

Rango
Es la diferencia entre el valor más alto y el valor más bajo en una distribución.
Mide la “distancia” que existe entre un punto y otro.
Se calcula restando el valor máximo del valor mínimo.
Rango = valor máximo – valor mínimo
Rango = valor máximo – valor mínimo
Rango = 35 – 24 = 11

TABLA 2 MATRICULA DE ESTUDIANTES Escuela: Aguayo del Norte
Desviación del dato
“ Deviation score”

Indica la distancia entre un dato en particular y la media o promedio.
Se denota como:
TABLA 2b MATRICULA DE ESTUDIANTES Escuela: Aguayo del Norte La suma de las desviaciones es 0 X - 30 – 30.3 = -0.3 32 – 30.3 = 1.8 32 – 30.3 = 4.8 32 – 30.3 = -1.3 32 – 30.3 = -2.3 32 – 30.3 = -1.3 32 – 30.3 = 4.8 32 – 30.3 = -6.3

Varianza
Es el promedio de las desviaciones elevadas al cuadrado.
Logra detectar diferencias en las variaciones.
Es la medida básica de variación.
Se denota como:

TABLA 2c MATRICULA DE ESTUDIANTES Escuela: Aguayo del Norte X - 30 – 30.3 = -0.3 32 – 30.3 = 1.8 35 – 30.3 = 4.8 29 – 30.3 = -1.3 28 – 30.3 = -2.3 29 – 30.3 = -1.3 35 – 30.3 = 4.8 24 – 30.3 = -6.3 = SS = (-0.3) 2 + (1.8) 2 + (4.8) 2 + (-1.3) 2 + (-2.3) 2 + (-1.3) 2 + (4.8) 2 + (-6.3) 2 SS = 95.5 = 95.5 / 8 = 11.9 = 95.5 / 7 = 13.6

Interpretación de la Varianza
Se interpreta como “unidades al cuadrado”.
Es muy útil en procedimientos avanzados pero fatal como estadística descriptiva.
Interpretación:
La media de la matricula tiene una desviación promedio de 13.6 estudiantes al cuadrado.
= 95.5 / 7 = 13.6

Desviación estándar
Es sencillamente la raíz cuadrada de la varianza.
De esta manera se soluciona el problema de la interpretación.
Se denota como:
Interpretación de la DE
Se interpreta como “unidades de desviación”.
Es muy útil para la estadística descriptiva.
Interpretación:
La media de la matricula tiene una desviación promedio de 3.7 estudiantes.
= = 3.7

Ejemplo de varianza y desviación estándar
Desviaciones estándar
Coeficiente de variabilidad
Expresa el porcentaje general de variación de los datos en referencia al promedio.
Se denota como:

Ejemplo:
CV = (3.7 ÷ 30.3) x 100 =
CV = (DE ÷ promedio) x 100 12.2%
Asignación – Calcule el rango, la varianza, la DE y el CV ID Estatura (pulg.) Peso (lbs.) 1 66 140 2 67 180 3 58 130 4 73 200 5 69 175 6 67 181 7 71 179

MEDIDAS ESPECIALIZADAS: Comparación de 2 poblaciones a través de su variabilidad

No hay comentarios:

Publicar un comentario en la entrada