Tema 4. DESCRIPCIÓN DE UNA VARIABLE: MEDIDAS DE DISPERSIÓN Y . - UC3M

Transcription

Tema 4. DESCRIPCIÓN DE UNA VARIABLE: MEDIDAS DEDISPERSIÓN Y DE FORMACONTENIDO:1.MEDIDAS DE DISPERSIÓN:9 Varianza9 Desviación típica9 Coeficiente de variación9 Rango9 Recorrido intercuartílico2.MEDIDAS DE FORMA:9 Asimetría9 ApuntamientoLecturas recomendadas: PP. 19-26 de La Estadística en Cómic, de L. Gonick y W. Smith. Capítulos 4 y 5 de Introducción a la Estadística para las Ciencias Sociales, deD. Peña y J. Romo.@Blanca Arteaga e Isabel Molina (Departamento de Estadística)1

1. Medidas de dispersiónEJEMPLO 1:DOS CONJUNTOS DE DATOS(Salarios anuales en de la empresa A)30700325003290033800341003450036000(Salarios anuales en de la empresa B)27500 3160031700 3380035300 3400040600Calcular la MEDIA y MEDIANA de ambosconjuntos de datos:Observa las representaciones gráficas.Señala la media y la mediana.Si nos dan solo la Media o la Mediana de unos datos ¿tenemos suficiente información?¿Cómo podemos medir cuán dispersos están los datos?@Blanca Arteaga e Isabel Molina (Departamento de Estadística)2

1. Medidas de dispersiónEJEMPLO 1: (Continuación)Calculamos las DISTANCIAS A LA MEDIA:Xi XEmpresa A30700325003290033800341003450036000Empresa 30060010002500Xi X-6000-1900-180030050018007100¿Cuánto suman nuestras dos nuevas columnas?PROPIEDAD DE LA MEDIA:(x i iN 1) X 0¿Por qué sucede esto?¿Cómo podemos medir cuán distintos son los datos de su media?@Blanca Arteaga e Isabel Molina (Departamento de Estadística)3

1. Medidas de dispersiónEJEMPLO 1: (Continuación)Ahora tomando el cuadrado de las distancias a la media:Empresa A30700325003290033800341003450036000(Xi X ) 0000Empresa B27500316003170033800340003530040600(Xi X ) 6840000LA VARIANZA: (xNi 1i XN)2 S2¿Qué mide esta cantidad?¿Qué unidad tiene esta medida?DESVIACIÓN TÍPICA:S@Blanca Arteaga e Isabel Molina (Departamento de Estadística)4

1. Medidas de dispersiónEJEMPLO 2:Los importes (en ) de los libros pedidos por los Deptos. de Estadística y de Informática en laúltima semana son:Depto. Informática: 329 332 335 323 338Depto. Estadística: 43 55 32 61 47Calcula la varianza de los importes para cada depto.¿En qué depto. han pedido libros con mayor variabilidad de precios?¿Es justo comparar simplemente la varianza?COEFICIENTE DE VARIACIÓNCV SXSolo se puede calcular cuando la media sea distinta de “0”.@Blanca Arteaga e Isabel Molina (Departamento de Estadística)5

1. Medidas de dispersiónEL RANGO: Es la diferencia entre el mayor y el menor de los datosEL RECORRIDO INTERCUARTÍLICO:Es la diferencia entre el tercero y elprimero de los cuartiles.EJERCICIO 1:Analizamos el volumen de consultas durante el periodo de exámenes en 10 bibliotecasuniversitarias, y se comparan con las anotadas el año anterior. El % de incremento deconsultas fue:10.22.93.16.85.97.37.08.23.74.3CALCULA EL RANGO Y EL RANGO INTERCUARTÍLICO@Blanca Arteaga e Isabel Molina (Departamento de Estadística)6

2. Medidas de formaASIMETRÍANHistogramas de dos conjuntos dedatos con media cero y varianza 1:N (xi 1x 0 x)S2 (xi i 1NNDistribución simétrica: la media dejapor la izquierda el mismo nº deobservaciones que por la derecha.2 1N3i x) (x 0i 1 x)3iN 1Distribución asimétrica por la derecha:Los valores pequeños son másfrecuentes que los grandes.@Blanca Arteaga e Isabel Molina (Departamento de Estadística)7

2. Medidas de formaMOMENTO DE ORDEN 3 RESPECTO DE LA MEDIA:Nm3 (xi i 1 x)3NCOEFICIENTE DE ASIMETRÍA DE FISHERm3CAF 3SCAF 0CAF 0CAF 0@Blanca Arteaga e Isabel Molina (Departamento de Estadística)SimétricaAsimétrica dcha.Asimétrica izq.8

2. Medidas de formaASIMETRÍACOEFICIENTE DE ASIMETRÍA DE PEARSONX MoCAP SCAP 0CAP 0CAP 0@Blanca Arteaga e Isabel Molina (Departamento de Estadística)SimétricaAsimétrica dcha.Asimétrica izq.9

2. Medidas de formaAPUNTAMIENTOHistogramas de dos conjuntos dedatos con media cero y varianza 1:N (xi 1 x)Nx 0S2 (xi i 1 x)NN 1(xi i 1 (x 3Distribución no apuntada (mesocúrtica):Los valores centrales son frecuentes.i 1 x)3NN4iN2 x) 04iN 4.75Distribución apuntada (leptocúrtica):Los valores centrales son muy frecuentes.@Blanca Arteaga e Isabel Molina (Departamento de Estadística)10

2. Medidas de formaAPUNTAMIENTOCOEFICIENTE DE CURTOSIS DE FISHERNm4 (xi 1 x)4iNm4CC 4 3S@Blanca Arteaga e Isabel Molina (Departamento de Estadística)CC 0 (mesocúrtica)CC 0 (leptocúrtica)CC 0 (platicúrtica)11

ACTIVIDADESACTIVIDAD 1:Calcula la media, la varianza, el coeficiente de asimetría de Fisher y el coeficientede curtosis para las siguientes calificaciones de un grupo de alumn@s:5087637556639855ACTIVIDAD 2:Pon un ejemplo de dos conjuntos de datos con idéntica media pero con varianzamuy distinta. Haz un histograma de cada conjunto de datos.Estandariza cada conjunto de datos: para ello, a cada dato réstale su media ydivídelo entre su desviación típica. Vuelve a hacer los histogramas de cadaconjunto de datos.@Blanca Arteaga e Isabel Molina (Departamento de Estadística)12

ACTIVIDADESACTIVIDAD 3:¿Puedes explicar por qué el momento de orden 3 respecto de la media, m3, nosindica la simetría/asimetría de la distribución?¿Por qué crees que hace falta dividir m3 entre S3 para medir la asimetría de unadistribución?ACTIVIDAD 4:Pon un ejemplo de dos conjuntos de datos con coeficientes de asimetría muydistintos. Haz un histograma de cada conjunto de datos.@Blanca Arteaga e Isabel Molina (Departamento de Estadística)13

MEDIDAS DE DISPERSIÓN: 9Varianza 9Desviación típica 9Coeficiente de variación 9Rango 9Recorrido intercuartílico 2. MEDIDAS DE FORMA: 9Asimetría 9Apuntamiento . Estandariza cada conjunto de datos: para ello, a cada dato réstale su media y divídelo entre su desviación típica. Vuelve a hacer los histogramas de cada conjunto de datos. 13