Curso De SPSS: M Odulo De Muestras Complejas I.E.A. Curso De SPSS - Us

Transcription

Curso de SPSS: Módulo deMuestras ComplejasI.E.A. Curso de SPSSMayo de 2009José A. Mayor GallegoDepartamento de Estadı́stica e Investigación OperativaUniversidad de Sevilla

Índice1. Introducción12. Diseños muestrales complejos y muestras complejas13. Estimación de parámetros. Ponderaciones64. Cálculo de los pesos74.1. Muestreo Aleatorio Simple Básico . . . . . . . . . . . . . . . . . . . .74.2. Muestreo con Probabilidades Variables Básico . . . . . . . . . . . . .74.3. Muestreo Aleatorio Simple Estratificado . . . . . . . . . . . . . . . .84.4. Muestreo por Conglomerados en Una Etapa. Selección de Conglomerados mediante Muestreo Aleatorio Simple . . . . . . . . . . . . . . .84.5. Muestreo por Conglomerados en Dos Etapa. Selección de conglomerados y de elementos mediante Muestreo Aleatorio Simple . . . . . . . .84.6. Muestreo por Conglomerados en Dos Etapa. Selección de conglomerados con Probabilidades Variables, y de elementos mediante MuestreoAleatorio Simple . . . . . . . . . . . . . . . . . . . . . . . . . . . . .95. Introducción básica al programa SPSS95.1. Editor de Datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .95.2. Manejo de archivos. Importación y exportación . . . . . . . . . . . .105.3. Cálculo sobre variables . . . . . . . . . . . . . . . . . . . . . . . . . .105.4. Visor de resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . .105.5. Aplicación del programa SPSS al diseño y análisis de muestras . . . .106. Seleccionar una muestra. Plan de Muestreo117. Analizar una muestra127.1. Estimación de parámetros a partir de una Muestra Aleatoria Simple.DATOS LEC PRENSA 1 . . . . . . . . . . . . . . . . . . . . . . . .127.1.1. La opción Calcular . . . . . . . . . . . . . . . . . . . . . . . .147.1.2. Análisis de los datos muestrales: Plan de análisis . . . . . . . .157.1.3. Análisis de los datos muestrales: Estimaciones . . . . . . . . .237.2. Estimación de parámetros a partir de Muestreo Aleatorio Simple Estratificado. DATOS LEC PRENSA EST . . . . . . . . . . . . . . . .24

SPSS Muestras Complejas1.1IntroducciónEn este documento, describiremos la aplicación del programa estadı́stico SPSSen el ámbito del muestreo en poblaciones finitas, en su doble vertiente de diseñar yanalizar encuestas por muestreo.Como es sabido, este potente programa estadı́stico contiene numerosas herramientas para el procesamiento estadı́stico de datos, tanto desde el puro análisis descriptivo,a las técnicas más avanzadas de la inferencia estadı́stica y el análisis multivariante.Recientemente, desde la versión 13, este programa ha sido ampliado con la posibilidadde construir y analizar “muestras complejas”, terminologı́a que ya aclararemos contodo lujo de detalles, pero que ahora, de forma anticipada podemos decir que significaque ya podemos emplear el SPSS de forma especı́fica en relación a las técnicas usualesdel muestreo en poblaciones finitas, es decir, obtener muestras y analizarlas.En concreto, el módulo que realiza estas tareas especı́ficas se denomina muestrascomplejas, lo que es una traducción de la terminologı́a inglesa complex samples,es decir, muestras complejas. Para justificar esta denominación y también a modo deintroducción [recordatorio para algunos] a los conceptos de la Teorı́a del Muestreoen Poblaciones Finitas que se van a manejar en relación a este programa, vamosa ver a continuación una descripción genérica, empleando ejemplos conectados conla realidad, de los diseños muestrales complejos. Aconsejamos dedicar la máximaatención a las probabilidades de inclusión, pues a partir de ellas se derivará elconcepto de peso, que como veremos es fundamental para la aplicación de este potentesoftware.2.Diseños muestrales complejos y muestras complejasEn el ámbito de la teorı́a del muestreo en poblaciones finitas, denominamos genéricamente DISEÑO COMPLEJO o DISEÑO MUESTRAL COMPLEJO a un diseñomuestral [para entendernos, un procedimiento para seleccionar una muestra a partirde una población] en el cual intervienen distintas estructuras poblacionales, ya seannaturales, de tipo administrativo, etc. Ya sabemos que, en su aspecto más básico, elproceso de muestreo y estimación comienza seleccionando de una población, U , unconjunto de elementos que determinan una muestra m. Esta selección es aleatoria yse puede hacer de muchas formas,Muestreo Aleatorio Simple.Muestreo de Bernoulli.Muestreo Sistemático Uniforme.Muestreos con Probabilidades Variables: Sampford, Madow, etc.José A. Mayor Gallego. Universidad de Sevilla

SPSS Muestras Complejas2Y un largo etcétera.En la referencias 1 y 2, el lector podrá encontrar información pormenorizada sobreestos procedimientos.En su forma más simple, y para que los estudiantes primerizos lo vayan entendiendo, los muestreos se estudian como si la muestra se extrajera directamente dela población, es decir, como si la población U fuera un marco directamente accesible, y los elementos de la muestra se seleccionaran de dicho marco mediante unprocedimiento que se aplica directamente sobre este.Esto que puede ser factible en algunas ocasiones, y de hecho se hace a veces,es problemático, difı́cil o imposible en muchas otras. Veamos dos situaciones paradigmáticas.1. Los elementos de la población presentan mucha variabilidad en relación a lacaracterı́stica que se estudia, lo que produce que las estimaciones presente muchoerror de muestreo. Una forma de disminuir este error es dividir la población enpartes más homogéneas y realizar muestreos en todas y cada una de estas partes.Las muestras obtenidas se unen o juntan para producir una única muestrafinal, m. Como puede verse, aquı́ los elementos no se seleccionan directamente,mediante un muestreo, de la población original, sino que esta se estructura enpartes, y la selección se realiza en cada parte. Como vemos, en esta situación loque se pretende en disminuir el error.2. La población, U , no es fácilmente accesible por determinadas circunstancias.Hay que decir que las cosas no son tan simples en la vida real, y que muchasveces no se dan las circunstancias adecuadas para construir una muestra pues nonecesariamente se dispone de un marco o ámbito bien definido de los elementosde los que se quiere seleccionar aquella.Si un encuestador es enviado a Jardines de Hércules [una urbanización formadapor un considerable número de grandes torres de apartamentos, en las afuerasde Sevilla, cerca del barrio exterior de Bellavista] para hacer una encuesta alas familias que allı́ habitan, puede tener problemas para seleccionar la muestrapues con seguridad no va a disponer de una lista bien elaborada de las unidadesfamiliares.Una solución serı́a seleccionar previamente mediante un muestreo en el conjuntode torres, poe ejemplo tres de las mismas, y a continuación estudiar cada unade estas tres torres seleccionadas, ya sea mediante un análisis exhaustivo de lastres, ya sea realizando nuevamente muestreos [serı́an tres] en cada una de ellas.No cabe duda de que el problema se ha simplificado bastante. Como vemos, enesta situación lo que se pretende es facilitar, o incluso a veces hacer posible, elmuestreo.José A. Mayor Gallego. Universidad de Sevilla

SPSS Muestras Complejas3A continuación, mediante diferentes ejemplos vamos a describir varias formas deseleccionar la muestra en situaciones reales, que a lo largo de décadas han sido ideadasy perfeccionadas por los estudiosos e investigadores en estas materias.EJEMPLO 1. MUESTREO ESTRATIFICADO. En una provincia geográfica,con gran actividad agrı́cola y dividida en siete comarcas de similar tamaño, se quiere realizar un estudio de la producción de cereal mediante la selección de una muestra de granjasen toda la provincia. Para ello, en cada comarca se realiza un muestreo seleccionando 10granjas por comarca. Al final, tenemos una muestra de 70 granjas formada por la uniónde las muestras obtenidas en cada comarca. Se supone que los siete muestreos básicosson independientes.En este caso, las unidades que se van a estudiar son las granjas de la provincia. Lasdivisiones que se utilizan, es decir, las comarcas, son de tipo administrativo. Esto es uncaso tı́pico de MUESTREO ESTRATIFICADO y las mencionadas divisiones se denominanESTRATOS. El muestreo se lleva a cabo de forma que en todas y cada una de las divisioneso estratos se realiza un muestreo.Nótese que el muestreo es complejo en el sentido de que para obtener la muestrafinal se ha aplicado una estructura especial de la población como son las comarcas, y elmuestreo se he realizad realmente en cada una. Al final tenemos una muestra final de 70granjas que NO se han obtenido directamente de la población provincial de granjas, sinoa través de las comarcas.EJEMPLO 2. MUESTREO POR CONGLOMERADOS. UNA ETAPA. Enun distrito municipal de una gran ciudad se desea realizar una encuesta entre la población joven de entre 16 y 25 años, para estudiar sus hábitos de lectura. Dicho distritoestá dividido en 47 secciones censales no muy extensas.Indiquemos que las secciones censales de un municipio son areas geográficas de tipoadministrativo delimitadas o definidas por ejemplo por ciertas calles o plazas. Estas divisiones son realizadas por los servicios estadı́sticos de los organismos públicos para facilitar elacceso a la información o poder llevar a cabo una labor administrativa racionalizada. Porejemplo, el Distrito Sur de Sevilla, en el cual se ubica nuestra Facultad de Matemáticas,cuenta con 82 secciones censales.Para seleccionar la muestra de jóvenes, se selecciona previamente una muestra decuatro secciones censales. A continuación, esas cuatro secciones se estudian de formaexhaustiva o completa, es decir, todos los jovenes de las mismas son entrevistados. Ası́, silas secciones censales de la muestra tienen respectivamente 200, 350, 120 y 250 jóvenes,la muestra final tendrá 920 jóvenes.En este caso, las unidades que se van a estudiar son los jóvenes del distrito, pero elmuestreo se hace inicialmente sobre las secciones, que son divisiones de tipo administrativo. Esto es un caso tı́pico de MUESTREO POR CONGLOMERADOS. Las seccionescensales son los conglomerados. Nótese la diferencia entre este ejemplo y el anterior. Enlos dos ejemplo, la población está dividida en partes, pero en el anterior, se hace unmuestreo EN cada parte, mientras que ahora se hace un muestreo DE partes.José A. Mayor Gallego. Universidad de Sevilla

SPSS Muestras Complejas4Nótese también que una vez construida la muestra de conglomerados, estos se estudian AL COMPLETO, por ello, este proceso se denomina MUESTREO POR CONGLOMERADOS EN UNA ETAPA, por que sólo hay una etapa o fase de muestreo, la de losconglomerados.EJEMPLO 3. MUESTREO POR CONGLOMERADOS. DOS ETAPAS.Es una variación del ejemplo anterior. En un distrito municipal de una gran ciudad sedesea realizar una encuesta entre la población joven de entre 16 y 25 años, para estudiarsus hábitos de lectura. Dicho distrito está dividido en 75 secciones censales cada una delas cuales con un número considerable de jóvenes.Indiquemos que las secciones censales de un municipio son areas geográficas de tipoadministrativo delimitadas o definidas por ejemplo por ciertas calles o plazas. Estas divisiones son realizadas por los servicios estadı́sticos de los organismos públicos para facilitar elacceso a la información o poder llevar a cabo una labor administrativa racionalizada. Porejemplo, el Distrito Sur de Sevilla, en el cual se ubica nuestra Facultad de Matemáticas,cuenta con 82 secciones censales.Para seleccionar la muestra de jóvenes, se selecciona previamente una muestra deseis secciones censales. A continuación, en cada una de esas seis secciones se realiza unmuestreo para seleccionar un conjunto de jóvenes.Nótese que ahora el muestreo global está compuesto de 1 6 7 muestreos distintos.En una primera fase o etapa se obtiene la muestra de secciones, y en una segunda fase oetapa, en cada sección de la muestra anterior, se obtienen muestras de jóvenes.Aquı́ tenemos un caso tı́pico de lo que se denomina MUESTREO POR CONGLOMERADOS EN DOS ETAPAS, pues hay dos etapas o fases de muestreo, como se describeen el párrafo anterior.De estos ejemplos se desprende una idea importante: en la práctica no nos vamosa encontrar, usualmente, con un muestreo básico o directo de los elementos. Perotenemos que decir que ni siquiera nos vamos a encontrar con situaciones menos simplescomo un muestreo estratificado o un muestreo por conglomerados. Muy al contrario,lo más usual será tener una combinación o mezcla de diferentes estructuras y diseñosmuestrales. Por ejemplo,Un muestreo estratificado, en el cual, en cada estrato, se realiza un muestreopor conglomerados en dos etapas.Un muestreo por conglomerados en dos etapas, en el cual, la segunda etapa serealiza mediante muestreo estratificado en cada conglomerado.Un muestreo por conglomerados en dos etapas, en el cual, la segunda etapa esa su vez un muestreo por conglomerados en dos etapas.Un muestreo estratificado, en el cual, en cada estrato, se realiza un muestreopor conglomerados en dos etapas, y en el cual, a su vez, la segunda etapa serealiza mediante muestreo estratificado en cada conglomerado.José A. Mayor Gallego. Universidad de Sevilla

SPSS Muestras Complejas5Y un largo etcétera de muchas más combinaciones.Además, a todo esto, hay que añadirle las múltiples posibilidades que hay alrealizar los muestreos básicos, en los que podemos emplear Muestreo Aleatorio Simple,Muestreo Sistemático Uniforme, Muestreo ΠPS en sus variadas formas, y un largoetcétera. La cosa entonces se nos presenta como muy complicada e inabordable peroque no cunda el pánico.En cualquiera de estas situaciones, sea cual sea la combinación de procedimientos,al final tenemos como resultante UN DISEÑO MUESTRAL que es el productofinal de la mezcla de todos los diseños muestrales que intervienen. Un diseño muestralde este tipo se denomina diseño muestral complejo. Las muestras obtenidas contales diseños se pueden por ello denominar muestras complejas. El módulo de SPSSdenominado precisamente Muestras Complejas nos permite,Construir este tipo de muestras, mediante distintas opciones de muestreo, ysuponiendo que intervienen diferentes estructuras, posiblemente combinadas:estratos y conglomerados.Analizar los datos muestrales para obtener estimaciones de parámetros, tantosi hemos obtenido la muestra ayudándonos con el propio SPSS como si no.En esta condensada panorámica trataremos ambas lı́neas, es decir, veremos cómoobtener muestras a partir de diversas especificaciones, y también veremos la forma deanalizar estos muestrales para obtener estimaciones de parámetros.IMPORTANTE: Es importante hacer notar que mediante SPSS podemos analizaruna muestra que haya sido diseñada o construida con el propio SPSS. Pero también podemos analizar muestras obtenidas o construidas de otra forma, siempre quedispongamos de la información adecuada.Como estrategia de estudio emplearemos la táctica de de empezar con situacionesmuy simples para ir introduciendo paulatinamente una complejidad mayor. Ası́, aunque parezca trivial, empezaremos considerando la estimación de parámetros basadaen una muestra aleatoria simple, sin estratos ni conglomerados de ningún tipo.Para ir captando la potencia de este “software” sı́ nos vamos a permitir considerarsubpoblaciones, realizando estimaciones, tanto globales como en dichas subpoblaciones. En todos los casos, utilizaremos ejemplos concretos, aunque no necesariamentereales.Queremos hacer notar que para realizar las estimaciones con un diseño complejo,en general no son útiles las expresiones básicas vistas en los tratados usuales sobremuestreo estratificado y muestreo por conglomerados, que han sido obtenidas en situaciones muy simplificadas. Entonces ¿Cómo proceder en tales situaciones? La clavede todo, tanto si quisiéramos hacer los cálculos sin ayuda de SPSS, como si vamos aemplear este programa, es calcular la probabilidades de inclusión.José A. Mayor Gallego. Universidad de Sevilla

SPSS Muestras Complejas3.6Estimación de parámetros. PonderacionesSi queremos estimar parámetros a partir de un muestreo realizado con un diseñocomplejo, por complicado que sea, al final nos vamos a encontrar con una muestrade elementos, y la clave consiste, básicamente, en calcular las probabilidades deinclusión.Si por ejemplo, queremos estimar el total de la variable Y a partir de una muestram, por compleja que sea la estructura, la cosa es tan simple como calcular las probabilidades de inclusión de primer orden de los elementos de la muestra, es decir, las πipara i m, y aplicar el estimador de Horvitz-Thompson,XX yi ωi yiTbHT (Y ) i mi m πisiendo,1 i mπies decir, al final siempre nos encontramos con una combinación lineal de los valoresyi multiplicados por unas cantidades, ωi que son los pesos o ponderaciones. Esteconcepto debe pues estar meridianamente claro.ωi Si lo que queremos estimar es la media poblacional de la variable, es decir, elparámetro Y , podemos emplear nuevamente el estimador de Horvitz-Thompson,1 X yiYb HT N i m πio también el estimador de Hájek,Xyi /πii mY HJ Xb1/πii mEs importante notar que el programa SPSS emplea el estimador de HorvitzThompson para la estimación de los totales, y el de Hájek para la estimación demedias y proporciones.Es decir, cuando el SPSS estima un total poblacional, emplea el estimador deHorvitzThompson,X yiXTbHT (Y ) ωi yii m πii msiendo yi la variable que se estudia, y ωi 1/πi los pesos que suministraremos alprograma.Cuando el parámetro es una media poblacional, o una proporción, emplea el estimador de Hájek,XXyi /πiωi yii mi mbY HJ X X1/πiωii mi mJosé A. Mayor Gallego. Universidad de Sevilla

SPSS Muestras Complejas7En suma pues, como puede verse, la clave es,“Calcular las Probabilidades de Inclusión”“y a partir de las mismas”“Calcular los Pesos”4.Cálculo de los pesosCuando la muestra a analizar ha sido previamente diseñada y obtenida medianteSPSS, es usual que contenga información sobre los pesos. Si no tenemos los pesos,ya sea por que la muestra ha sido obtenida por otros medios, o por otras razones,tendremos que calcularlos. Damos ahora algunas indicaciones.4.1.Muestreo Aleatorio Simple BásicoSi N es el tamaño de la población, y n es el tamaño de la muestra, las probabilidades de inclusión son,nπi Npor lo que los pesos son,Nωi n4.2.Muestreo con Probabilidades Variables BásicoEstos muestreos se realizan empleando una variable de TAMAÑO, de tal formaque los elementos “MÁS GRANDES” tengan más probabilidad de ser seleccionados.Si denotamos Xi a dicha variable, T (X) a la suma, sobre la población, de todos lostamaños, y n al tamaño de la muestra, las probabilidades de inclusión son,πi nXiT (X)ωi T (X)nXipor lo que los pesos son,Uno de los procedimientos de este tipo más empleados es el método de Sampford.Dicho método permite obtener n elementos muestrales sin reemplazamiento y conprobabilidades de inclusión variables y proporcionales a Xi .IMPORTANTE: SPSS sólo contempla este tipo de muestreo cuando se seleccionanconglomerados, y exclusivamente en la primera etapa.José A. Mayor Gallego. Universidad de Sevilla

SPSS Muestras Complejas4.3.8Muestreo Aleatorio Simple EstratificadoPara simplificar supongamos dos estratos, de tamaños N1 y N2 , en los que seseleccionan respectivamente n1 y n2 elementos mediante sendos muestreos aleatoriossimples en cada estrato. Las probabilidades de inclusión son,πi n2n1en el estrato 1 y πi en el estrato 2N1N2por lo que los pesos son,ωi 4.4.N1N2en el estrato 1 y ωi en el estrato 2n1n2Muestreo por Conglomerados en Una Etapa. Selecciónde Conglomerados mediante Muestreo Aleatorio SimpleSupongamos que hay M conglomerados, y se seleccionan g. La probabilidad deinclusión de un elementos será la del conglomerados al que pertenece, es decir,πi gMωi Mgpor lo que los pesos son,4.5.Muestreo por Conglomerados en Dos Etapa. Selecciónde conglomerados y de elementos mediante MuestreoAleatorio SimpleSupongamos que hay M conglomerados, y se seleccionan g. En el conglomeradok, con Nk elementos, seleccionamos nk . La probabilidad de inclusión de un elementosserá la del conglomerados al que pertenece multiplicada por la del elemento dentrodel conglomerado, es decir,g nkπi M Nkpor lo que los pesos son,M Nkωi g nkEn general, habrá tantos pesos distintos como conglomerados.José A. Mayor Gallego. Universidad de Sevilla

SPSS Muestras Complejas4.6.9Muestreo por Conglomerados en Dos Etapa. Selecciónde conglomerados con Probabilidades Variables, y deelementos mediante Muestreo Aleatorio SimpleSupongamos que hay M conglomerados, y se seleccionan g. La selección se hace,por ejemplo mediante el método de Sampford, empleando el tamaño de los conglomerados como variable tamaño. Notemos que la suma de todos los tamaños es NEn el conglomerado k, con Nk elementos, seleccionamos nk mediante muestreoaleatorio simple. La probabilidad de inclusión de un elementos será la del conglomerados al que pertenece multiplicada por la del elemento dentro del conglomerado, esdecir,gnkgNk nk πi N NkNpor lo que los pesos son,Nωi gnk5.Introducción básica al programa SPSSEl programa estadı́stico SPSS contiene una imponente baterı́a de procedimientosestadı́sticos que cubren numerosos campos de la Estadı́stica: Análisis Descriptivo,Multivariante, Inferencia, Gráficos, y un largo etcétera. No es la finalidad de estecurso abarcar todo el SPSS, lo que serı́a además imposible en tan corto espacio detiempo. Nos centraremos en el módulo de Muestras Complejas, y también veremosalgunos aspectos básicos que son indisponsables.5.1.Editor de DatosAl entrar en SPSS usualmente nos encontraremos el editor o visor de datos. Esuna cuadrı́cula, similar a una hoja de cálculo. Tiene dos pestañas:Vista de datos: Activa el editor de datos propiamente dicho. Cada columna esuna variable. Por defecto las variables son denotadas V00001, V00002, etc. También por defecto son numéricas, con una anchura de 8 dı́gitos, y dos decimales.Estos parámetros pueden modificarse.Vista de variables: Activa el editor de variables, donde podemos cambiar losnombres de las mismas, el tipo, las dimensiones, etc. También podemos asignarnombres significativos a los valores de una variable cualitativa codificada.José A. Mayor Gallego. Universidad de Sevilla

SPSS Muestras Complejas5.2.10Manejo de archivos. Importación y exportaciónEl SPSS tiene su formato propio de datos con la extensión .SAV. Es posible, deforma directa y fácil, importar datos de otros formatos como EXCEL, ası́ como grabara otros formatos.Con la opción Archivo - Nuevo - Datos podemos abrir un editor de datos enblanco.Con la opción Archivo - Abrir - Datos podemos abrir un archivo de datos yaexistente.Las opciones Archivo - Guardar y Archivo - Guardar como son las usualesen los programas del entorno Windows.5.3.Cálculo sobre variablesA veces, es necesario realizar un conjunto de operaciones sobre una o varias variables para obtener otras nuevas que necesitamos para ejecutar un análisis.Por ejemplo, si tenemos una muestra obtenida en dos etapas, y en dos variablestenemos respectivamente las ponderaciones de la primera y segunda etapa, podemosmultiplicar ambas ponderaciones, para cada elemento de la muestra, y obtener unanueva variable con las ponderaciones de todo el proceso muestral.Este tipo de operaciones se realiza con la opción Transformar - Calcular, quepermite manipular y operar sobre varias variables y guardar los resultados en unanueva variable.5.4.Visor de resultadosSPSS coloca todos los resultados que se van obteniendo de los sucesivos análisisen una ventana denominada Visor de Resultados. Mediante una estructura deárbol que aparece a la izquierda, es posible moverse cómodamente a través de todoel contenido, que usualmente puede llegar a ser muy extenso.Es posible seleccionar un objeto (gráfico, tabla, etc), copiarlo y pegarlo en otraaplicación de Windows, como Word o Excel.También es posible, mediante Edición - Seleccionar todo - Copiar objetos,copiar y pegar el contenido completo del visor.5.5.Aplicación del programa SPSS al diseño y análisis demuestrasComo hemos mencionado anteriormente, desde la versión 13., el programa SPSSincluye un módulo para el diseño y análisis de datos recogidos a partir de un diseñoJosé A. Mayor Gallego. Universidad de Sevilla

SPSS Muestras Complejas11muestral complejo.Con la opción Archivo - Nuevo - Datos podemos abrir un editor de datosen blanco. A este módulo se accede a partir de la opción general Analizar, y a continuación, la subopción Muestras Complejas. Seguidamente describimos con algunosejemplos el funcionamiento de este módulo. Para un estudio más profundo recomendamos la lectura de los manuales técnicos y de los documentos donde se describen losalgoritmos y expresiones matemáticas implementadas.6.Seleccionar una muestra. Plan de MuestreoPara llevar a cabo esta tarea, suponemos que en el editor de datos tenemos LAPOBLACIÓN. Esto no significa que tengamos todos los datos poblacionales al completo, incluidas las variables de estudio, pues en tal caso el muestreo carecerı́a desentido. Se puede decir que lo que tenemos en el ordenador es el MARCO.Podemos tener las variables que definen las estructuras básicas, como son estratosy conglomerados. Las variables de tamaño, para llevar a cabo muestreos con probabilidades variables, etc. Incluso, en un muestreo en varias etapas, podemos tener lainformación sólo de la primera etapa, para obtener una primera muestra de conglomerados.La idea básica es pues que primero obtendremos la muestra de individuos, y acontinuación realizaremos la recolección de datos de estudio sobre la misma. SPSS nosahorra pues todo el proceso de selección aleatoria de individuos, que en un muestreode varias etapas puede ser sumamente complicado.Ahora necesitamos elaborar un PLAN DE MUESTREO. Un plan de muestreo esun conjunto de especificaciones que, a partir de la estructura de los datos que vamosa muestrear, sirve al programa SPSS para realizar la selección de elementos.Este plan de muestreo se puede definir de varias formas, pero nosotros lo haremossiempre empleando el llamado Asistente de Muestreo. Al final, este plan o conjuntode especificaciones se graba en un Fichero de Plan, que tiene la extensión .CSPLAN.Elegiremos la opción Analizar - Muestras Complejas - Seleccionar una muestra. Aparece una ventana en la que podemos elegir entre CREAR un plan de muestreo nuevo,EDITAR un plan de muestreo ya existente, o pasar directamente a la EXTRACCIÓNde una muestra (esto requiere que ya haya un plan).En principio, si estamos en el inicio, emplearemos la primera opción. Mediante laopción Examinar es posible escoger el directorio en el cual se grabará el fichero conel plan que creemos, ası́ como su nombre. Por defecto la extensión es .CSPLAN.IMPORTANTE: Si introducimos directamente el nombre del plan de muestreoen la ventanita, sin usar la opción Examinar, es obligatorio escribir la extensión.CSPLAN, pues en caso contrario el SPSS grabará el fichero de plan sin extensiónalguna, lo que puede ocasionar dificultades y problemas posteriores.José A. Mayor Gallego. Universidad de Sevilla

SPSS Muestras Complejas12Seguidamente, a lo largo de una serie de menús, iremos escogiendo las opcionesadecuadas a nuestro problema, seleccionando las variables que definirán estratos yconglomerados en las sucesivas etapas.Al final, podemos optar por colocar la muestra sobre nuestra misma ventanadel Editor de Datos, o en una ventana distinta, o incluso enviarlo a un fichero conextensión .SAV, es decir, el formato de SPSS.7.Analizar una muestraPara describir este proceso, emplearemos varios ejemplos, empezando por el másbásico, o sea, el Muestreo Aleatorio Simple. Posteriormente añadiremos nuevas estructuras como estratos conglomerados.7.1.Estimación de parámetros a partir de una Muestra Aleatoria Simple. DATOS LEC PRENSA 1De una población de N 10000 personas mayores de 16 años, hemos seleccionadouna muestra de n 80 empleando Muestreo Aleatorio Simple, MAS(10000, 80), conobjeto de realizar un estudio sobre hábitos de lectura de periódicos en el mes anterior. Como suele ser bastante habitual, los distintos valores de las variables se hancodificado mediante cantidades numéricas. Las variables estudiadas son,1. LECTOR: ¿Lée Vd. regularmente algún periódico? [1: Sı́, 2: No]2. N MENSUAL: Número de periódicos que compró Vd. mensualmente en elanterior mes.3. PERIÓDICO: ¿Qué periódico lee usualmente Vd.? [1: El Paı́s, 2: El Mundo,3: ABC, 4: Ninguno]4. SEXO: Sexo [1: Hombre, 2: Mujer]5. EDAD: Grupo de Edad [1: De 16 a 30 años, 2: De 31 a 65 años, 3: De 66 añosen adelante]Nótese que en este ejemplo no hay estratos ni conglomerados. La muestra se obtiene ı́ntegramente de la población total, sin intervención de ninguna estructura predeterminada. Esto no es muy realista pero nos servirá para ir asimilando la mecánicadel programa poco a poco. Sı́ existen dos variables, SEXO y EDAD, que definen subpoblaciones, tanto individualmente como por su cruce, y que nos permitirán realizarestimaciones desagregadas como por ejemplo, la estimación de la proporción de lectores de ABC en las mujeres, o la estimación del número medio de periódicos adquiridospor los hombres de 66 años en adelante. Los datos recogidos tienen un aspecto comoel que se expone a continuación,José A. Mayor Gallego. Universidad de Sevilla

SPSS Muestras ComplejasElemento Encuestado123.13SEXO112.EDAD121.LECTOR121.N MENSUAL15012.PERIÓDICO141.La primera tarea que hay que llevar a cabo es la introducción de datos en laplantilla de SPSS. Esto se hace en la forma habitual. La primera columna no

SPSS Muestras Complejas 1 1. Introduccion En este documento, describiremos la aplicaci on del programa estad ıstico SPSS en el ambito del muestreo en poblaciones finitas, en su doble vertiente de disenar y analizar encuestas por muestreo. Como es sabido, este potente programa estad ıstico contiene numerosas herramien-