GEOGEBRA COMO RECURSO PARA UNAS NUEVAS

Transcription

GEOGEBRA COMO RECURSO PARAUNAS NUEVAS MATEMÁTICASESTADÍSTICA CON GEOGEBRAVirgilio Gómez Rubio Mª José Haro DelicadoBaeza 20141

ESTADÍSTICA DESCRIPTIVA2

Estadística descriptiva1. El puntaje de Apgar se usa para evaluar reflejos yrespuestas de recién nacidos. A cada bebé unprofesional de la medicina le asigna un puntaje y losvalores posibles son enteros entre cero y diez. Se tomauna muestra de 1000 bebés nacidos en cierto condadoy los resultados han sido los siguientes:012345132425356789198 367 216 1311018 Halla la media de los puntajes de Apgar. Halla ladesviación típica de la muestra. Halla la mediana muestral. ¿Cuáles son los cuartiles primero y tercero?3

Resolviendo con Geogebra Abrimos la hoja de cálculo Introducimos en la 1ª columna los valores de la variable y en la segundalas frecuencias absolutas Creamos sendas listas.4

Cálculo de las medidas de centralización y dispersiónMedia[ Lista de Números , Lista de Frecuencias ] media 7.14Mediana[ Lista de Números , Lista de Frecuencias ] mediana 7La moda sólo se puede calcular para valores sin agruparVarianza poblacional: Varianza[ Lista de Números , Lista de Frecuencias ] 1.72Varianza muestral: VarianzaMuestral[ Lista de Números , Lista de Frecuencias ]Desviación típica poblacional: DE[ Lista de Números , Lista de Frecuencias ]Desviación típica muestral: DEMuestral[ Lista de Números , Lista deFrecuencias ] 1.31Q1[lista1, lista2] 6Q3[lista1, lista2] 85

Algunas representaciones gráficas2. En un estudio sobre la amnesia postraumática tras una lesióncraneal, se estudió el tiempo en días que estuvieron los pacientes encoma. Se recogieron los datos siguientes:2 8914166108713 121111111315101115 1220 Construir un diagrama de barras Construir un diagrama de tallo y hojas para estos datos. ¿Parecenestar los datos simétricamente distribuidos? Construir un diagrama de cajas y bigotes para los datos. ¿Da lamisma impresión de simetría que con el diagrama de tallo y hojas? ¿Existen datos puntuales que puedan considerarse como atípicos?6

DIAGRAMA DE BARRASBarras[ Lista de Datos en Bruto , Ancho deBarras ]Si el ancho de barras es 0, se obtiene unaespecie de agujas a diferentes alturas.También se puede trabajar con frecuencias y conotras opciones.En este caso, como losvalores de la variable vande 1 en 1, es convenienteque el ancho de lasbarras sea de longitud 17

DIAGRAMA DE TALLOS Y HOJASDiagramaTalloHojas[ Lista ]8

DIAGRAMA DE TALLOS Y HOJASDiagramaTalloHojas[ Lista , Ajuste -1 0 1 ]En este caso el valor del ajuste es -1.Significa que la unidad se divide por10.Los valores a cuyo lado no apareceel cero no corresponden a valoresde la variable.9

DIAGRAMA DE CAJAS Y BIGOTESDiagramaCaja[ Offset y , Escala y , Lista deDatos en Bruto ]El problema de calcular el diagrama de cajas y bigotesutilizando la instrucción anterior es que los bigotes seextienden hasta los valores máximo y mínimo, con locual, no sirve para detectar los valores atípicos.10

3.Parte de un estudio de control de calidad tuvo comoobjetivo mejorar una línea de producción. Se midieron lospesos (en onzas) de 50 barras de jabón. Los resultadosson los siguientes, ordenados de menor a mayor.a) Construye un diagrama de tallos y hojas para estosdatos.b) Construye un histograma para estos datos.c) Construye un diagrama de cajas para estos datos.¿Identifica datos atípicos?11

Usaremos Análisis de una variableSeleccionamos nuestros datos en la hoja decálculo y hacemos clic sobre “Análisis de unavariable” y después en “analiza”12

Si pinchamos sobre el botón queindica la flecha anterior,podemos agregar la tabla defrecuencias y el polígono defrecuencias entre otras cosas.La tabla de la izquierda en la queaparecen las medidas decentralización,posiciónydispersión, se obtiene pinchandosobre el botón en el que apareceel signo sumatorio.13

14

Si hay frecuencias absolutas, éstas, deben formar parte de una lista ypinchando sobre la rueda de la esquina superior derecha, podemosintroducirlas. Para hacerlo, seleccionamos la columna que las contengay pinchamos sobre la mano que aparece encima de las celdas15

16

Para el diagrama de cajas, se procede de manera similar. Se nosda la opción de que aparezcan los datos atípicos, si los hay.17

A PRACTICAR18

ESTADÍSTICA DESCRIPTIVAPARA DOS VARIABLES19

20

Introducimos los datos en dos columnas y usamos la opción Análisis regresiónde dos variables. De esta forma, obtenemos tanto el diagrama de dispersión,como el diagrama de residuos y un resumen estadístico de la relación entre lasdos variables. Se realizan diversos tipos de ajustes y se pueden usar para predecirvalores de la variable dependiente.Se pueden intercambiar las variables, pasando la variable dependiente a serindependiente.21

También se puede realizar usando comandos seleccionando previamente las doscolumnas de datos y eligiendo la opción “crea lista de puntos”AjusteLineal[ Lista de Puntos ]22

El diagrama de residuos lo podemos obtener con la opciónDiagramaResidual[ Lista de Puntos , Función ]introduciendo en la opción Función, la ecuación de la recta obtenida previamente.Para obtener el coeficiente de correlación, usaríamosSpearman[ Lista de Puntos ]También hay opciones para calcular las medias, varianzas ydesviaciones típicas marginales, así como para calcular lacovarianza.23

A PRACTICAR24

VARIABLES Y MODELOS DEDISTRIBUCIÓN25

26

a) Creamos un deslizador para c y representamos gráficamente la función f(x) c x. Eldeslizador se puede iniciar en 0, ya que una de las condiciones que debe cumplir unafunción de densidad es el ser positiva, f(x) 0 y, en este caso, x [0,2]Se calcula el área en función del valor de c con el comandoIntegral[ Función , Valor Inicial de x , Valor Final de x ]b) Después de obtener el valor de c, en este caso de 0.5, calculamos27

c) Para calcular la media usamosIntegral[x*0.5*x,0,2]. Obtenemosd) Para hallar la varianza, podemos usarIntegral[x² 0.5 x, 0, 2] – (Integral[x 0.5 x, 0, 2]) 2e) Para hallar la función de distribución, podemoscrear un nuevo deslizador, k, que tome valores en elintervalo [0,2]. A continuación, obtenemos el valordistribución Integral[0.5 x, 0, k].Para que se visualice la función de distribucióncreamos el punto A(k, distribución) y activamos elrastro, poniendo el deslizador k en animaciónautomática.28

h) Para responder a esta pregunta basta con calcularIntegral[0.5*x,0.8,2]29

A PRACTICAR2. La lectura de un termómetro calibrado en agua helada(temperatura real de 0ºC) representa una variable aleatoria confunción de densidad de probabilidad : k 1 x 2f ( x) 0 1 x 1en cualquier otro casoDetermina el valor de k¿Cuál es la probabilidad de que el termómetro indique unatemperatura mayor a 0ºC?¿Cuál es la probabilidad de que la lectura esté dentro de los0.25ºC de la temperatura real?¿Cuál es la media de la lectura?¿Cuál es la mediana de la lectura?¿Cuál es la desviación típica?30

3. Las puntuaciones de una pruebaestandarizada se distribuyen normalmente conmedia de 480 y desviación típica de 90.¿Cuál es la proporción de puntuacionesmayores a 700?¿Cuál es el 25º percentil de laspuntuaciones?Si la puntuación de alguien es de 600 ¿Enqué percentil se encuentra?¿Qué proporción de las puntuaciones seencuentra entre 420 y 520?31

a) 1 - Normal[480, 90, 700] 0.0073b) NormalInversa[ Media , DesviaciónEstándar , Probabilidad ]NormalInversa[480,90,0.25] 419.296.Consideramos que es el percentil 420c) Normal[ Media , Desviación Estándar ,x, Booleana Acumulativa ]Normal[480, 90, 600, true] 0.909, lo queimplica prácticamente un percentil 91d) Normal[ 480,90, 520,true]-Normal[480,90,420,true] 0.41932

APROXIMACIÓN DE LA BINOMIALMEDIANTE LA NORMAL33

1. El 45% de los condensadores de una cierta partida presenta deficienciasa) ¿Cuál es la probabilidad de que presenten deficiencias 1, 2, 3, 4, ,10 de loscondensadores?b) ¿Cuál es la probabilidad de que de diez condensadores presenten deficiencias unnúmero menor o igual a la mitad.c) ¿Puede la distribución aproximarse a la distribución normal?Calcula la probabilidad de que de diez condensadores examinados, la mitadpresente dichas deficiencias utilizando la distribución normal.a)Distribución Binomial[ Número de Ensayos , Probabilidad de Éxito , AcumuladaBooleana ]DistribuciónBinomial[10, 0.45, false]34

b) DistribuciónBinomial[ Número de Ensayos , Probabilidad de Éxito , Valorde Variable , Acumulada Booleana ]DistribuciónBinomial[ 10,0.45,5,true] 0.738c) nq 5.5 5, µ np 0.45 10 4.5 no es mayor o igual que 5, pero no queda muylejos, por lo tanto, aunque muy en el límite, lo podríamos admitir. 2 npq 10 0.45 0.55 2.475; 1.575.5 4.5 4.5 4.5P 5 P Z 1.57 1.57Normal[ Media , Desviación Estándar , x, Booleana Acumulativa ]Normal[4.5, 1.57, 5.5,true]- Normal[4.5, 1.57, 4.5,true] 0.738-0.5 0.238Si queremos comparar con el valor que se obtiene mediante el modelo binomialusamos, DistribuciónBinomial[ Número de Ensayos , Probabilidad de Éxito , Valor de Variable , Acumulada Booleana ] DistribuciónBinomial[10, 0.45,5,False ] 0.23435

Otra forma de hacer lo mismo:36

Vamos a hacer un estudio más exhaustivo de la aproximación del modelobinomial por el modelo normal, analizando modelos binomiales con diferentesmedias y desviaciones típicas y comparándolo con el modelo normalVamos a crear dos deslizadores, uno que tomará los valores para n y otro parap.El deslizador para n abarcará un rango que vaya, por ejemplo, desde 1 hasta1000, con pasos de 1 en 1. El deslizador para p irá desde 0 a 1, con pasos de0.01.Aunque especifiquemos así los pasos, es difícil que los saltos no sean mayoresy que haya valores que nos saltemos. Para solventar este problema, podemoscrear casillas de control. Les damos los nombres n y p y los vinculamos aldeslizador correspondiente. Podemos modificar la longitud de la casilla deentrada en estilo.Creamos la distribución binomial con DistribuciónBinomial[n,p] y dosvariables37

Ajustamos una curva normal de media y desviación típica , conNormal[ , ,x].Para que sean los que sean los valores de p y de n la imagen se muestresiempre en pantalla, iremos a Vista gráfica y modificaremos el rango enlos ejes.Eje X ( -3 , 3 )Eje Y (-0.1, f( ) 0.1Como en las casillas correspondientes de la vista gráfica no podemosintroducir directamente los símbolos y , los introducimos en laentrada, los copiamos (control c) y los pegamos después (control V).38

Si queremos calcular las probabilidades de que la variable esté endeterminados intervalos, lo podemos hacer con la función Integral yhablar del factor de corrección de Yates. Por ejemplo, si queremoscalcular la probabilidad de que r 4, deberíamos hacerlo conIntegral[f, - , 4.5].Para estudiar en qué casos se puede aproximar el modelo binomial porel modelo normal, podemos fijar los valores de p e ir variando los de ncon la animación automática. De esta forma observamos cómoevoluciona el ajuste de ambos modelos.39

DISTRIBUCIÓN DE LA MEDIA MUESTRALTEOREMA CENTRAL DEL LÍMITE40

MODELO DE DISTRIBUCIÓN UNIFORMEEn la casilla A1 ponemos UniformeAleatoria[0, 1].Extendemos hacia abajo para generar una muestra, tantascasillas como tamaño queramos para la muestra (tomemosn 40).A continuación, nos movemos hacia la derecha para generarmás muestras del mismo tamaño.En la casilla A41 escribimos Media[A1:A40], se obtiene lamedia y nos movemos hacia la derecha para obtener lasmedias de todas las muestras. Creamos una lista con esasmedias (llamémosla lista1).41

Ahora toca representarlas y lo hacemos con la siguienteinstrucción.Histograma[Clases[lista1, 10], lista1, false].Hemos utilizado la instrucción Histograma[ Lista de límites declases , Lista de datos brutos , Usar densidad o no(true/false) , Factor de escala de densidad (opcional) ].Para lista de límites de clase hemos incluido la instrucciónClases[ Lista de datos , Número de clases ]. Lista de datos es la lista que contiene las medias muestrales, y Número declases contiene el número de intervalos que queremos obtener. Lista de datos brutos es de nuevo nuestra lista de mediasmuestrales y no usaremos densidades, poniendo false en la zonacorrespondiente. Hemos dicho que se genere un histograma con10 intervalos, con los valores de lista 1.42

Para que se vea bien el histograma, ponemos en vista gráficacomo valores mínimo y máximo de la x, -0.1 y 1.1,respectivamente.Ahora representamos la curva normal correspondiente al modelode distribución uniforme [0,1] que tiene una media de: 01 x1 x 11dx 1 0 2 0 22y una desviación típica igual a1 x dx 102402 x3 1 3 0 440 1 11 3 4 12404043

Lo hacemos con la instrucción Normal[0.5,1/sqrt(12*40),x]Para representar la curva uniforme usamos Uniforme[0,1,x]44

Si queremos hacer un estudio de la variable correspondiente a lasmedias muestrales, podemos seleccionar la columna y hacer clicsobre Análisis de una variable.Si se pone, histogramanormalizado se superpone unacurva normal de media lamediadelasmediasmuestrales y desviación típicala de las medias muestrales.También obtendremos unresumen de las medidas decentralización y dispersión dela variable medias muestrales.45

46

Podemos analizar la normalidad de los datosescogiendo Gráfico Q-Q Cuantil Normal47

A PRACTICARAnalizad la media muestralpara muestras procedentesde un modelo de Poisson48

INTERVALOS DE CONFIANZA YCONTRASTE DE HIPÓTESIS49

1. Un atleta efectúa seis lanzamientos,obteniendo distancias de 58, 69, 64, 57, 64 y66 metros. Halla un intervalo de confianzapara la media del 90%. Contrastar la hipótesisde que la media poblacional es mayor o igualque 66.IntervaloMediaT[ Lista de datos (muestra) , Nivel ]En lista 2, geogebra nosdevuelve los extremos delintervalo50

Para realizar el contraste de hipótesis, consideramoscomo hipótesis alternativa H1: 66, frente a la hipótesisnula H0: 66TestMediaT[ Lista de datos (muestra) , Media(hipótesis) , Cola ]TestMediaT[ lista1, 66, “ ” ].La respuesta es lista2 {0.09, -1.58}.El primer valor corresponde al p-valorEl segundo valor, corresponde al estadístico decontraste.51

2. En una muestra de tamañon 16, se mide una media 6 y unadesviación típica s 12. ¿Es el valorde la media significativamentemayor que 0? Usa un nivel deconfianza de 0.0552

En este caso no disponemos de los datos en bruto,podemos usarTestMediaT[ Media (muestra) , Desviación estándar (muestra) , Tamaño(muestra) , Media (hipótesis) , Cola ]Hay otra forma:Vamos a calculadorade probabilidades,dentro del menú queofrece la hoja decálculo53

O bien, dentro del menú de la vista gráfica54

Diferentes tests que se pueden utilizar55

Si queremos obtener un intervalo T de confianza para lamedia 56

A PRACTICAR3. Se quiere averiguar si ha habido una reducciónsignificativa en el porcentaje de votantes a undeterminado partido político, en el último año. Paraello se eligieron al azar 100 personas y se les preguntósi votarían al partido en cuestión, obteniéndose unporcentaje de respuestas afirmativas del 39%. Si elporcentaje de votantes a favor del partidoconsiderado era del 42% hace un año, cuando sepreguntó a 150 personas, contrasta a nivel designificación 0.05 si la reducción habida ha sidosignificativa.57

4. En el laboratorio de física, dos alumnos realizan variasmedidas sobre la relación carga-masa (e/m) delelectrón, obteniendo los siguientes resultados:¿Es el valor de la relación carga-masa obtenido por elsegundo alumno significativamente menor que elvalor real: e / m 1.75 1011C / kg ?Suponiendo varianzas poblacionales iguales, calculaun intervalo de confianza para la diferencia demedias ¿Son las medias significativamente diferentesentre sí? Usa 0.05 en todos los casos.58

ANOVA59

Para trabajar el análisis de la varianza, podemos teclearen la línea de entrada ANOVA[ Lista , Lista , . ]60

Introducimos los datos utilizando la hoja de cálculo y creamos variaslistas, tantas como tratamientos diferentes haya.Utilizamos la instrucción ANOVA[ Lista , Lista , . ]En una nueva lista aparecen dos valoresEl primero corresponde al p-valorEl segundo valor corresponde al estadístico de contraste (cociente decuadrados medios).61

Si queremos realizar un análisis individual de las variables,podemos utilizar “Análisis multivariable”62

También podemos realizar el análisis de la varianza desde el mismositio, e incluso contrastes de hipótesis e intervalos de confianza parala diferencia de medias63

A PRACTICAR64

MUCHAS GRACIAS65

Normal[480, 90, 600, true] 0.909, lo que implica prácticamente un percentil 91 d) Normal[ 480,90, 520,true]-Normal[480,90, 420,true] 0.419 . APROXIMACIÓN DE LA BINOMIAL MEDIANTE LA NORMAL 33 . 34 1. El 45% de los