Post on 06-Apr-2018
8/3/2019 Est Inf Aplicada
1/166
Violeta Alicia Nolberto Sifuentes
Mara Estela Ponce Aruneri
ESTADSTICA INFERENCIAL APLICADA
Unidad de Post Grado de la Facultad de Educacinde la Universidad Nacional Mayor de San Marcos
8/3/2019 Est Inf Aplicada
2/166
2
Primera edicin:
Lima, 2008.
Violeta Alicia Nolberto Sifuentes.
Mara Estela Ponce Aruneri.
Unidad de Post Grado de la Facultad de Educacin
de la Universidad Nacional Mayor de San Marcos.
Serie:
Textos de la Maestra en Educacin.
UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS
FACULTAD DE EDUCACIN
UNIDAD DE POST GRADO
Rector : Dr. Luis Izquierdo VsquezDecano : Dr. Carlos Barriga Hernndez
Director de la UPG : Dr. Elas Meja Meja
Comit Directivo de la UPG : Dra. Elsa Barrientos Jimnez
Dr. Kenneth Delgado Santa Gadea
Mg. Rubn Mesa Marav
8/3/2019 Est Inf Aplicada
3/166
3
DedicatoriaDedicatoriaDedicatoriaDedicatoria
Para Sandra Natalia (Mara Estela)
Para Ernesto Alonso (Violeta Alicia)
8/3/2019 Est Inf Aplicada
4/166
4
CONTENIDO
Prefacio
Agradecimientos
Captulo 1. La estadstica y su relacin con la investigacin cientfica
1.1. Introduccin 001
1.2. Definicin de estadstica 002
1.3. Investigacin cientfica 004
1.4. Objetivos fundamentales de la investigacin cientfica 005
1.5. Paradigmas de la investigacin 005
1.6. Clasificacin de la estadstica 008
Captulo 2. Estadstica inferencial
2.1. Introduccin 010
2.2. Poblacin 011
2.3. Muestra 012
2.4. Muestra aleatoria 012
2.5. Muestra aleatoria aplicada 013
2.6. Parmetro 014
2.7. Estadstico 015
2.8. Distribucin muestral 017
2.9. Estimacin 022
2.10. Prueba de hiptesis 023
2.11. Estadstica paramtrica 0252.12. Estadstica no paramtrica 026
Ejercicios propuestos 027
Captulo 3. Estimacin de parmetros
3.1. Introduccin 029
3.2. Propiedades de los estimadores 029
3.3. Estimacin de parmetros mediante intervalos de confianza 032
8/3/2019 Est Inf Aplicada
5/166
5
3.4. Intervalo de confianza para estimar la media de una poblacin normal 033
3.5. Intervalo de confianza para estimar la varianza poblacional
2 de una poblacin normal 039
3.6. Intervalo de confianza para estimar la proporcin poblacional de una poblacin binomial 041
3.7. Intervalo de confianza para estimar diferencia de medias poblacionales,
21 , de poblaciones normales 044
3.7.1. Usando muestras independientes 044
3.7.2. Usando muestras relacionadas 050
3.8. Intervalo de confianza para estimar la razn de varianzas poblacionales,
22
21
, de poblaciones normales independientes 054
3.9. Intervalo de confianza para estimar la diferencia de proporciones
poblacionales, 21 , de poblaciones binomiales independientes 056
Ejercicios propuestos 060
Captulo 4. Prueba de hiptesis paramtrica
4.1. Introduccin 0664.2. Conceptos bsicos 067
4.3. Etapas para realizar una prueba de hiptesis 075
4.4. Prueba de para de una poblacin normal 076
4.5. Prueba para 2 de una poblacin normal 082
4.6. Para de una poblacin binomial 0854.7. Prueba para 21 usando muestras independientes 088
4.7.1. Cuando las varianzas poblacionales son conocidas 089
4.7.2. Cuando las varianzas poblacionales son desconocidas 092
4.8. Para 21 usando muestras relacionadas 100
4.9. Para la igualdad de varianzas poblacionales 104
4.10. Para 21 de poblaciones binomiales 110
Ejercicios propuestos 112
8/3/2019 Est Inf Aplicada
6/166
6
Captulo 5. Anlisis de regresin lineal mltiple
5.1. Introduccin 116
5.2. Modelo de regresin lineal simple 117
5.3. Grfico o diagrama de dispersin 118
5.4. Modelo de regresin lineal simple poblacional 119
5.5. Estimacin de los parmetros del modelo de regresin lineal simple 120
5.6. Evaluacin del ajuste global del modelo 122
5.7. Adecuacin del modelo: Anlisis de residuos 125
5.8. Modelo de regresin lineal mltiple 131
5.9. Prueba de la significancia de la regresin 134
5.10. Correlacin lineal simple 141
Ejercicios propuestos 143
Captulo 6. Pruebas de hiptesis no parmetricas
6.1. Introduccin 145
6.2. Prueba binomial 146
6.3. Prueba U de Mann-Whitney 149
6.4. Prueba de rangos de Wilcoxon 155
6.5. Prueba de Kruskal-Wallis 159
6.6. Prueba de Kolmogorov-Smirnov 164
Ejercicios propuestos 168
Captulo 7. Anlisis de datos categricos
7.1. Introduccin 170
7.2. Tablas de contingencia 170
7.3. Estadstica Chi-cuadrado 1717.4. Prueba de hiptesis de homogeneidad 172
7.5. Prueba de hiptesis de independencia 176
Ejercicios propuestos 180
Anexo
Uso de Excel en el clculo de los valores de algunas variables aleatorias 000
8/3/2019 Est Inf Aplicada
7/166
7
PREFACIO
El presente libro se ha elaborado a solicitud de la Unidad de Post Grado de la Facultad de
Educacin de la Universidad Nacional Mayor de San Marcos, y tiene como objetivo ser una
gua en el curso de Estadstica Inferencial, que se desarrolla en el plan de estudios de la
Maestra en Educacin, en sus diferentes menciones.
Por tanto, se ha escrito tomando en cuenta a un grupo heterogneo de profesionales, en el
sentido de que los maestristas de esta facultad son en su mayora de la especialidad de
educacin, y en su quehacer profesional no emplean cotidianamente las herramientas
estadsticas. De ah, que el esfuerzo de las autoras sea desarrollar paso a paso las aplicaciones
que se presentan en este libro.
Los clculos que se presentan para aplicar las herramientas de la inferencia estadstica son
para que los lectores entiendan sus cmo y porqu y, asimismo, la interpretacin de los
resultados obtenidos. Dejamos bien en claro que en ningn momento se pretende adiestrar a
lo lectores en clculos, sino en que aprendan los conocimientos tericos estadsticos de la
inferencia (saber), apliquen las herramientas estadsticas (saber hacer) y desarrollen una
actitud positiva hacia la estadstica. Esto es, que la estadstica no solamente es clculo, o el
simple uso de las frmulas o expresiones que aparecen en ste y en diversos libros de
estadstica, sino razonamiento crtico basado en evidencias objetivas que se obtienen de la
poblacin bajo estudio (ser).
Una vez que el lector haya asimilado los conocimientos estadsticos, y sus aplicaciones, que
brindamos en el presente libro, estar en la capacidad de usar software estadstico, que es un
instrumento comparable a una calculadora. El aprendizaje de estadstica usando softwareestadstico no debe reducirse, sin embargo, a manipulaciones mecnicas, pues ste sirve como
apoyo del profesor para mostrar, en forma precisa y rpida, los grficos y clculos
estadsticos.
VIOLETA ALICIA NOLBERTO SIFUENTES
MARA ESTELA PONCE ARUNERI
8/3/2019 Est Inf Aplicada
8/166
8
AGRADECIMIENTOS
Al Dr. Elas Meja Mejia, Director de la Unidad de Post Grado de la Facultad de Educacin
de la Universidad Nacional Mayor de San Marcos, por brindarnos la oportunidad de entregar
al mundo acadmico el presente libro, en particular a los maestristas de la mencionada
facultad, que lo usaran como gua para el aprendizaje del Curso de Estadstica Inferencial, en
el plan de estudios vigente. Tambin por considerarnos como docentes de tan prestigiada
unidad de post grado.
A nuestros profesores de pregrado del Departamento Acadmico de Estadstica de la
Universidad Nacional Mayor de San Marcos, quienes nos formaron en tan importante
especialidad, cuyas enseanzas y exigencias acadmicas para con nuestra preparacin
profesional en estadstica, han permitido que podamos seguir enseando y difundiendo la
estadstica, no solo en el mbito sanmarquino sino en otros.
A nuestros alumnos, por la paciencia e inters en aprender estadstica, por sus comentarios y
sugerencias para con nuestro desempeo docente.
A todos los lectores docentes, alumnos, empresarios, en general todos aquellos que tomaran
decisiones basadas en evidencias objetivas, en concordancia con el mundo en que vivimos,
caracterizado por el constante aprendizaje y el manejo adecuado de la informacin, en
particular de la informacin estadstica.
Asimismo a los que nos hagan llegar sus comentarios, observaciones y dudas respecto a lo
tratado en el presente libro, los mismos que contribuirn con la enseanza y la difusin de la
estadstica.
Finalmente a nuestras familias, por el apoyo, comprensin y aliento, para con el desarrollo del
presente libro.
8/3/2019 Est Inf Aplicada
9/166
9
CAPTULO 1
LA ESTADSTICA Y SU RELACIN CON
LA INVESTIGACIN CIENTFICA
1.1.INTRODUCCIN
Los profesionales de la Educacin como parte de su quehacer profesional realizan
investigacin cientfica: evaluacin de la calidad de la educacin, someten a prueba diferentes
mtodos de comprensin lectora, estudian problemas del aprendizaje, entre otros. Es as, que
contamos con Internet como fuente general de informacin, que permite disponer de
informacin educativa, por ejemplo, sobre Evaluaciones Muestrales, que realiza el Ministerio
de Educacin y que se encuentra disponible en la pgina web:
www2.minedu.gob.pe/umc/index2.php?v_codigo=47&v_plantilla=2 (23.03.08) que a la
letra dice:
Dentro de las Evaluaciones Nacionales que ha realizado la Unidad de Medicin de la
Calidad (UMC) podemos distinguir dos tipos: las muestrales y las censales. A la fecha
la UMC ha realizado cuatro evaluaciones muestrales y dos evaluaciones censales. En
una evaluacin muestral se selecciona a un conjunto de estudiantes de una poblacin
(objetivo). Las evaluaciones muestrales realizadas por la UMC son representativas de
la poblacin objetivo planteadas en los distintos estudios (p. e. estudiantes peruanos de
sexto grado de primaria, estudiantes peruanos de Instituciones Educativas Estatales de
quinto grado de secundaria, etc.). La seleccin de una muestra representativa de
estudiantes permite hacer inferencias de las poblaciones a partir de la informacin
recogida.
Para Castillo Arredondo (2003), evaluar:
Es el acto de valorar una realidad que forma parte de un proceso cuyos momentos
previos son la fijacin de las caractersticas de la realidad a valorar y de la recogida de
informacin sobre la misma, y cuyas etapas posteriores son la informacin y/o toma de
decisiones en funcin del juicio de valor emitido.
8/3/2019 Est Inf Aplicada
10/166
10
Por tanto, si el educador desea evaluar el rendimiento escolar, es necesario conocer las
caractersticas de esta realidad escolar, llamada estadsticamente, poblacin. Si est en
condiciones de recolectar los datos de toda la poblacin se denomina censo, es decir datos de
todos y cada uno de los escolares para lograr los objetivos propuestos, o por el contrario, si
toma o selecciona un grupo de escolares, se denomina una muestra representativa (muestra
probabilstica o aleatoria) de escolares, y a travs de la muestra intentar conocer la realidad
de la poblacin escolar.
Cuando se trabaja con una muestra probabilstica y queremos conocer a la poblacin, a partir
de los datos muestrales, empleamos los mtodos que ofrece la Estadstica Inferencial, que en
el presente libro nos ocupar varios captulos.
Este libro es a nivel bsico, tratando de ser lo ms amigable posible, tomando en cuenta que
nos dirigimos a profesionales no estadsticos, en particular de la Educacin.
Amigable en el sentido que obviaremos las demostraciones matemtico-estadsticas, pero si
ser necesario tomar en cuenta las definiciones de la estadstica as como la rigurosidad para
aplicar los mtodos estadsticos de la inferencia.
Pero antes es necesario que se conozca la naturaleza de la Estadstica en particular de la
Estadstica Inferencial.
1.2.DEFINICIN DE ESTADSTICA
Existen diversas definiciones, veamos algunas:
Para Sierra Bravo (1991), la Estadstica es:
La ciencia formada por un conjunto de teoras y tcnicas cuantitativas, que tienen por
objeto la organizacin, presentacin, descripcin, resumen y comparacin de conjunto
de datos numricos, obtenidos de poblaciones en su conjunto de individuos o
fenmenos o bien de muestras que representan las poblaciones estudiadas, asi como el
estudio de su variacin, propiedades, relaciones, comportamiento probabilstico de
8/3/2019 Est Inf Aplicada
11/166
11
dichos datos y la estimacin inferencia o generalizacin de los resultados obtenidos de
muestras, respecto a las poblaciones que aqullas representan. La Estadstica en la
investigacin cientfica, dada la necesidad de manejar y tratar en ellas grandes
cantidades, progresivamente crecientes, de datos.
Nocedo de Len Irma, et al (2001), anotan que:
La Estadstica es la ciencia encargada de suministrar las diferentes tcnicas y
procedimientos que permiten desde organizar la recoleccin de datos hasta su
elaboracin, anlisis e interpretacin. Abarca dos campos fundamentales la Estadstica
Descriptiva y la Estadstica Inferencial.
Para Hopkins y Glass, (1997): La Estadstica es un lenguaje para comunicar informacin
basada en datos cuantitativos.
Montgmery, Douglas (1985), define a la Estadstica como: El arte de tomar decisiones acerca
de un proceso o una poblacin con base en un anlisis de la informacin contenida en una
muestra tomada de la poblacin.
Otra definicin de la Estadstica que lo vincula al uso cientfico de principios matemticos a
la coleccin, al anlisis, y a la presentacin de datos numricos. Contribuyen con la
investigacin cientfica diseando pruebas y experimentos; la coleccin, el proceso, y el
anlisis de datos; y la interpretacin de los resultados, aplicando conocimientos matemticos
y estadsticos. El conocimiento estadstico se aplica a la biologa, economa, ingeniera,
medicina, salud pblica, psicologa, comercializacin, educacin y deportes. Muchas
decisiones econmicas, sociales, polticas, y militares no se pueden tomar objetivamente sinel empleo adecuado de la estadstica.
Traduccin adaptada por las autoras del libro, tomada de:
www.amstat.org/Careers/index.cfm?fuseaction=main (01.04.08)
En nuestro medio profesional o en la sociedad en general se requiere solucionar un problema
o verificar un supuesto, para desarrollar la ciencia, la tcnica y la educacin entre otros
8/3/2019 Est Inf Aplicada
12/166
12
mbitos; en particular respecto a los alumnos sobre rendimiento acadmico, aptitud cientfica,
desarrollo social y la desercin entre otros. Tambin respecto al docente sobre su desempeo
en aula, su formacin acadmico-profesional, los recursos didcticos que emplea y la
produccin cientfica, entre otros. Respecto al sistema educativo, financiamiento de la
educacin, gestin acadmica, informtica educativa y modelos educativos, entre otros.
Todos estos problemas no pueden ser resueltos por iniciativas subjetivas, por pareceres o
lluvia de ideas; sino en base a informacin valida y confiable, esto es, tener informacin lo
ms prximo a la realidad bajo estudio. Indudablemente esto se logra empleando la ciencia
llamada Estadstica.
Para resolver estos problemas se debe seguir de manera organizada, sistemtica y planificada,
es decir debemos realizar Investigacin Cientfica.
1.3.INVESTIGACIN CIENTFICA
Es una forma especial de buscar el conocimiento, presenta toda una serie de caractersticas
que la diferencian de otras formas de abordar la realidad, como son el conocimiento emprico
espontneo y el razonamiento especulativo. A continuaciones se presentan algunas
definiciones:
Ezequiel Ander-Egg (1995), define investigacin como:
Un procedimiento reflexivo, sistemtico, controlado y crtico, que permite descubrir
nuevos hechos o datos, relacin o leyes, en cualquier campo del conocimiento
humano. Para entender qu se asume por investigacin cientfica debemos conocer sunaturaleza, sus aspectos o caractersticas, como son:
1. Es un procedimiento mediante el cual se recogen nuevos conceptos de fuentes
primarias, una investigacin existe cuando se ha pasado por el proceso de
comprobacin y verificacin de un problema, el replantear lo ya conocido no se puede
llamar investigacin.
8/3/2019 Est Inf Aplicada
13/166
13
2. Una investigacin es un aporte importante para el descubrimiento de principios
generales por su naturaleza inferencial.
3. La investigacin es un trabajo de exploracin profesional, organizada o sistemtica y
exacta.
4. Es lgica y objetiva.
5. En lo posible procura ofrecer resultados cuantitativos de los datos manejados.
6. El fin de una investigacin se expresa en un informe el cual presentar no solo la
metodologa, resultados, experimentaciones, sino tambin las conclusiones y
recomendaciones finales.
1.4.OBJETIVOS FUNDAMENTALES DE LA INVESTIGACIN CIENTFICA
En relacin a las funciones que realiza la ciencia, los objetivos fundamentales de una
Investigacin Cientfica son:
1. Describir la realidad. Proceso importante y necesario en el proceso del conocimiento
cientfico donde las tcnicas y mtodos se aplican para recopilar datos y hechos, y
establecer generalizaciones empricas.
2. Explicar la realidad. Refleja mediante generalizaciones tericas (principios, leyes,
conceptos) las propiedades y regularidades esenciales y estables de los fenmenos, as
como los factores causales que los determinan.
3. Predecir la realidad. La explicacin de la realidad y las generalizaciones tericas,
permiten que cumpla con el objetivo de predecir los comportamientos futuros de los
fenmenos, esto es, establecer pronsticos dentro de un determinado lmite de la
probabilidad.
8/3/2019 Est Inf Aplicada
14/166
14
Como funcin prctica y utilitaria, la ciencia transforma la realidad en correspondencia con
las necesidades y demandas de la sociedad, a fin de lograr un bienestar, mejorar la calidad de
vida.
Entonces la ciencia indaga su objeto de estudio utilizando de una manera sistemtica y
rigurosa, empleando mtodos y medios especiales de conocimiento que permiten obtener
datos empricos confiables, as como un reflejo profundo y exacto de las regularidades
esenciales de la realidad.
En este caso, los mtodos estadsticos cumplen funciones cognoscitivas importantes como
herramienta de investigacin cientfica, por tanto el proceso de investigacin cientfica
encuentra su fundamento metodolgico en la concepcin cientfica general de la realidad
objetiva. Pero cmo conocer la realidad?
1.5.PARADIGMAS DE LA INVESTIGACIN
Un paradigma es un enfoque general que asume el investigador y es de carcter ontolgico,
epistemolgico y metodolgico. Este ltimo tiene que ver con las vas, formas,
procedimientos y estrategias que se consideran apropiados para estudiar al objeto, responde a
la pregunta Cmo se conoce a la realidad?
En la literatura del mtodo cientfico se habla con frecuencia de dos paradigmas de la
investigacin cientfica, como son: el cualitativo y el cuantitativo.
Para sintetizar, estos dos paradigmas, se presenta la siguiente tabla, disponible en:
www.fisterra.com/mbe/investiga/cuanti_cuali/cuanti_cuali.asp (22.03.08).
8/3/2019 Est Inf Aplicada
15/166
15
Tabla N 1.1
Ventajas y desventajas entre mtodos cualitativos y cuantitativos
Mtodos cualitativos Mtodos cuantitativos
Propensin a "comunicarse con" los
sujetos del estudio.
Propensin a "servirse de" los sujetos del
estudio.
Se limita a preguntar. Se limita a responder.
Comunicacin ms horizontal () entre
el investigador y los investigados ()
mayor naturalidad y habilidad de estudiar
los factores sociales en un escenario
natural.
Son fuertes en trminos de validez interna,
pero son dbiles en validez externa, lo que
encuentran no es generalizable a la
poblacin.
Son dbiles en trminos de validez interna
-casi nunca sabemos si miden lo que
quieren medir-, pero son fuertes en
validez externa, lo que encuentran es
generalizable a la poblacin.
Preguntan a los cuantitativos: Cun
particularizables son los hallazgos?
Preguntan a los cualitativos: Son
generalizables tus hallazgos?
Podemos afirmar que como todo mtodo cientfico, se debe reconocer sus ventajas y
desventajas, lo importante es determinar el momento adecuado para aplicarlo en el desarrollo
de la investigacin cientfica.
Pero destacamos que el paradigma cuantitativo se vale de la Estadstica para garantizar el
estudio de muestras representativas y para el anlisis de los datos, como tambin para efectuar
generalizaciones a partir de los resultados de estas muestras representativas.
Tambin, para realizar investigacin va el paradigma cuantitativo, se ha empleado
previamente el paradigma cualitativo; pero lo importante es tener la certeza de su aplicacin
8/3/2019 Est Inf Aplicada
16/166
16
para solucionar problemas de una investigacin cientfica, sta debe reunir ciertas
caractersticas.
En otros casos ser necesario emplear ambos paradigmas, como por ejemplo cuando se trata
de evaluar la Calidad de la Educacin, en particular la Educacin Superior, no es suficiente
uno de ellos se deben emplear ambas. La realidad es muy compleja, multifactorial, dinmica,
por lo tanto, ambos paradigmas se complementan, no son excluyentes.
Una vez establecido el objeto de estudio en base a los conocimientos tericos, se inicia la
etapa de Diseo Metodolgico (Diseo), donde se define el proceso de recoleccin de datos,
delimitando las unidades bajo estudio y las variables a medirse, que permitan contestar las
preguntas formuladas, en el proyecto de investigacin cientfica. Es indudable que, la
Estadstica es una poderosa herramienta para planificar y desarrollar el Diseo Metodolgico.
Los datos obtenidos, de la realidad investigada, se analizan aplicando los mtodos y tcnicas
estadsticas para contrastar sus posibles divergencias con las consecuencias que se deducen de
las hiptesis. Por tanto nos preguntamos:
Las respuestas que ustedes proporcionen dejan notar la relacin que existe entre Estadstica e
Investigacin Cientfica.
Entonces la Estadstica es la herramienta que ayuda a tener la seguridad, certeza y
confianza de que los datos recogidos responden a la realidad que se pretende investigar,
en trminos de Estadstica Aplicada.
Cmo se llevar a cabo el estudio para investigar sobre diferentes problemas y aristasdel trabajo educativo, para el logro de sus objetivos y/o verificacin de sus hiptesis?
Cmo se realizar la investigacin, a fin de maximizar la validez y confiabilidad de la
informacin y reducir errores en los resultados?
8/3/2019 Est Inf Aplicada
17/166
17
1.6.CLASIFICACIN DE LA ESTADSTICA
Dependiendo de cmo se analizan los datos, la Estadstica se clasifica como:
1.6.1. ESTADSTICA DESCRIPTIVA
Rama de la Estadstica que trata sobre la descripcin y anlisis estadstico de una poblacin,
que resumen y presenta datos obtenidos de la poblacin o de una muestra, mediante mtodos
adecuados.
Tiene como objetivo, caracterizar los datos, de manera grfica o analtica, para resaltar las
propiedades de los elementos bajo estudio.
La siguiente pregunta: En promedio el nmero total de respuestas correctas, de una prueba
de compresin lectora, es la misma en todas las secciones de quinto grado de primaria de
Instituciones Educativas de Lima Metropolitana?, se resuelve con el apoyo de la Estadstica
Descriptiva.
1.6.2. ESTADSTICA INFERENCIAL
Rama de la Estadstica que estudia el comportamiento y propiedades de las muestras y la
posibilidad, y lmites, de la generalizacin de los resultados obtenidos a partir de aquellas a
las poblaciones que representan. Esta generalizacin de tipo inductivo, se basa en la
probabilidad. Tambin se le llama tambin Estadstica Matemtica, por su complejidad
matemtica en relacin a la Estadstica Descriptiva.
Tiene como objetivo, generalizar las propiedades de la poblacin bajo estudio, basado en los
resultados de una muestra representativa de la poblacin.
La siguiente pregunta: El instrumento Perso, clasifica y discrimina adecuadamente, a partir
de variables de personalidad, a los alumnos de Educacin Bsica Secundaria segn requieran
o no una escolarizacin especial? se resuelve con el apoyo de la Estadstica Inferencial.
8/3/2019 Est Inf Aplicada
18/166
18
En cuanto a la Probabilidad, Juez Martel, Pedro y Diez Vegas, Francisco Javier (1997),
manifiestan que: Hoy en da la Probabilidad y la Estadstica, ntimamente unidas en s,
desempean un papel fundamental en prcticamente todos los campos del saber, tanto en las
ciencias naturales como en las ciencias humanas, papel que va cobrando cada vez mayor
importancia.
La siguiente pregunta: Cunto es la probabilidad de que un alumno de Educacin Bsica
Secundaria requiera una escolarizacin especial, a partir de las variables de su personalidad?
es un caso tpico que se resuelve con el apoyo de la probabilidad y se logra empleando
modelos probabilsticos.
Nosotros recordamos al estudiante que los mtodos estadsticos son las herramientas ms
peligrosas en manos de gente inexperta. Pocas materias tiene una aplicacin tan amplia;
Ninguna requiere tal cuidado en su aplicacin.
RECUERDE
Ningn mtodo estadstico puede corregir los defectos por una inadecuada seleccin
del problema que se investiga, o por una mala recoleccin de datos. Una investigacin
que empieza mal, con seguridad termina mal.
CON DATOS DE MALA CALIDAD, NO SER POSIBLE DAR RESPUESTA
ADECUADA A UN PROBLEMA CIENTFICO
La estadstica es una de esas ciencias cuyos adeptos deben ejercer la automoderacin de
un artista.
George Udny Yule y Maurice Kendal
8/3/2019 Est Inf Aplicada
19/166
19
CAPTULO 2
ESTADSTICA INFERENCIAL
2.1. INTRODUCCIN
Tambin se le llama Inferencia Estadstica, pero previamente recordemos que la Estadstica
(EI) comprende el conjunto de mtodos estadsticos que permiten deducir (inferir) cmo se
distribuye la poblacin bajo estudio a partir de la informacin que proporciona una muestra
representativa, obtenida de dicha poblacin. Ver seccin 1.6.2 del presente libro.
Para que la Estadstica Inferencial proporcione buenos resultados debe:
1. Basarse en una tcnica estadstico-matemtica adecuada al problema y suficientemente
validada.
2. Utilizar una muestra que realmente sea representativa de la poblacin y de un tamao
suficiente.
Veamos el siguiente ejemplo:
Ejemplo 2.1
Se realiza un estudio para comparar tres mtodos para ensear tcnicas de comprensin
lectora en ingls a escolares de segundo grado de Educacin Bsica Secundaria, como son:
El mtodo de la enseanza recproca.
El mtodo de instruccin directa.
La combinacin de mtodos de instruccin directa y enseanza recproca.
8/3/2019 Est Inf Aplicada
20/166
20
Las preguntas por resolver son:
1. Cul de los mtodos mejora la comprensin lectora?
2. Para el prximo ao el mtodo identificado como el mejor, dar buenos resultados, para
el alumno Javier Hernndez Len, quin realizar el segundo grado de Educacin Bsica
Secundaria?
La primera pregunta es un caso de incertidumbre, porque, basndonos en el estudio de tres
muestras independientes y en igualdad de condiciones se aplicar uno de los tres mtodos a
cada muestra de manera independiente; con el apoyo de la Estadstica Inferencial absolvemos
esta pregunta, eligiendo a la que mejora significativamente la Comprensin Lectora, para este
tipo de alumnos.
La segunda pregunta es un caso de toma de decisiones, porque Javier Hernndez Len no ha
participado en el estudio, pero se le aplicar el mejor mtodo que resulte de la investigacin
realizada, ahora bien, con qu confianza, diremos que ese mtodo lograr que Javier mejore
su comprensin lectora en ingls.
Los casos de incertidumbre y toma de decisiones son resueltos por la Estadstica Inferencial,
por supuesto apoyado por la probabilidad.
Para iniciarse en el estudio y aplicacin de la Estadstica Inferencial es necesario
conocer los conceptos bsicos que a continuacin se van a tratar.
8/3/2019 Est Inf Aplicada
21/166
21
2.2. POBLACIN
Este concepto vamos a definir bajo diferentes enfoques. En investigacin cientfica se le
define como la totalidad de elementos sobre los cuales recae la investigacin. A cada
elemento se le llama unidad estadstica, sta se le observa o se le somete a una
experimentacin, estas unidades son medidas pertinentemente.
Si representamos mediante, X, una variable aleatoria bajo investigacin, al estudiar a esta
variable en la poblacin, como resultado tendremos los valores:
NXXXX ...,,,, 321
Donde N es el total de elementos de la poblacin.
Ejemplo 2.2
Sea X, una variable aleatoria que representa la calificacin obtenida en la prueba de
conocimientos sobre educacin ambiental (escala vigesimal), de los alumnos de la Facultad
de Educacin, si la poblacin consta de 300 alumnos, entonces:
300321 ...,,,, XXXX
Es una poblacin en trminos de variable aleatoria, que se lee as:
La calificacin que ha obtenido el alumno 1 en la prueba de conocimientos sobre educacin
ambiental, la calificacin que ha obtenido el alumno 2 en la prueba de conocimientos sobre
educacin ambiental, la calificacin que ha obtenido el alumno 3 en la prueba de
conocimientos sobre educacin ambiental, y as sucesivamente hasta la calificacin que ha
obtenido el alumno 300 en la prueba de conocimientos sobre educacin ambiental.
El propsito de un estudio estadstico es extraer conclusiones acerca de la naturaleza de la
poblacin, pero resulta que las poblaciones son grandes o por razones de tica, recursos
8/3/2019 Est Inf Aplicada
22/166
22
financieros, metodolgicos u otros no ser posible entonces se debe trabajar con una muestra
extrada de la poblacin bajo estudio.
2.3. MUESTRA
Sierra Bravo (1991) anota que: Una muestra en general, es toda parte representativa de la
poblacin, cuyas caractersticas debe reproducir en pequeo lo ms exactamente posible.
Para que sea representativa se debe seleccionar empleando el muestreo, tpico importante de
la Estadstica, con la finalidad de que los resultados de esta muestra sean validos para la
poblacin de la que sea obtenido la muestra. Esta generalizacin se realiza empleando la
estadstica inferencial.
2.4. MUESTRA ALEATORIA
Una muestra aleatoria de tamao n de la funcin de distribucin de la variable aleatoria X es
una coleccin de n variables aleatorias independientesn
XXXX ...,,,, 321 cada una con la
misma funcin de distribucin de la variable aleatoriaX.
Ejemplo 2.3
Consideremos nuevamente la poblacin definida en el ejemplo 2.2, la variable de inters es X,
calificacin obtenida en la prueba de conocimientos sobre educacin ambiental (escala
vigesimal), de los alumnos de la Facultad de Educacin. Asumiremos que tiene distribucin
de probabilidad con mediax y Varianza
2x . No se conoce ni la distribucin exacta de X ni
el valor numrico de x o de2
x . Se trata de caractersticas de la poblacin que pueden
determinarse con precisin si se revisa cada una de las calificaciones de los 300 alumnos. Para
tener una idea del valor dex se extrae una muestra aleatoria de tamao n = 6 de la
poblacin. Entonces:
1X : La calificacin que ha obtenido en la prueba de conocimientos sobre educacin
ambiental, el primer alumno seleccionado en la muestra.
8/3/2019 Est Inf Aplicada
23/166
23
2X : La calificacin que ha obtenido en la prueba de conocimientos sobre educacin
ambiental, el segundo alumno seleccionado en la muestra.
6X : La calificacin que ha obtenido en la prueba de conocimientos sobre educacinambiental, el sexto alumno seleccionado en la muestra.
Puesto que la seleccin de los alumnos, en este caso es seis, es aleatoria o al azar:
654321 ,,,,, XXXXXX
Constituye variables aleatorias. Se admite que son independientes y cada una con la mismadistribucin que la variable aleatoria X. En un sentido matemtico el trmino muestra
aleatoria, se refiere, no a seis alumnos seleccionados para este estudio sino a las seis variables
aleatorias 654321 ,,,,, XXXXXX asociadas con los alumnos.
La definicin matemtica de variable aleatoria es terica, para extraer conclusiones prcticas
acerca de la poblacin en base a la muestra seleccionada deben determinarse los valores
numricos de las variables nXXXX ...,,,, 321 .
No estamos tratando con un conjunto de unidades estadsticas seleccionadas, ni con un grupo
de variables tericas sino con un conjunto de n nmeros reales, es decir nxxxx ...,,,, 321 . Estos
nmeros son los valores observados de las variablesn
XXXX ...,,,, 321 respectivamente, para
una determinada muestra aleatoria extrada de la poblacin. Esto conduce a la siguiente
definicin.
2.5. MUESTRA ALEATORIA APLICADA
Una muestra aleatoria de tamao n es un conjunto de n observaciones nxxxx ...,,,, 321 sobre
las variables nXXXX ...,,,, 321 independientes e idnticamente distribuidas.
8/3/2019 Est Inf Aplicada
24/166
24
Ejemplo 2.4
Para el caso del ejemplo 2.3, una vez identificados los seis alumnos, podemos determinar los
valores numricos de las seis variables aleatorias654321
,,,,, XXXXXX . Supongamos que el
primer alumno seleccionado ha obtenido 13 en la prueba de educacin ambiental en este caso,
la variable aleatoria 1X toma el valor 1x = 13.
Si el segundo alumno seleccionado ha obtenido 10 en la prueba de educacin ambiental en
este caso, la variable aleatoria 2X toma el valor 2x = 10. De igual forma las variables
aleatorias 6543 ,,, XXXX tomarn valores numricos que van a depender de las calificaciones
que obtienen los alumnos seleccionados en tercera, cuarta, quinta y sexta seleccin.
Ahora estamos utilizando el termino muestra aleatoria no para referirnos a los alumnos
seleccionados o a las variables aleatorias asociados con ellos sino a los seis valores numricos
654321 ,,,,, xxxxxx que toman respectivamente cada una de las seis variables aleatorias.
Por tanto hay tres formas de considerar a una muestra aleatoria:
1. Como un conjunto de unidades seleccionadas y que son sometidos al estudio.
2. Como un conjunto de variables aleatorias tericas asociadas con esas unidades
3. Como un conjunto de valores numricos tomadas por las variables.
Las definiciones no son equivalentes pero estn estrechamente relacionadas.
2.6. PARMETRO
Sierra Bravo (1991) indica que parmetro deriva del vocablo griegoparmetreo que significa
medir una cosa con otra:
8/3/2019 Est Inf Aplicada
25/166
25
En estadstica se refiere a los valores o medidas que caracterizan una poblacin como
por ejemplo la media y la desviacin tpica de una poblacin () Son cantidades
indeterminadas constantes o fijas respecto a una condicin o situacin que caracteriza
a un fenmeno en un momento dado que ocurre en una poblacin.
Se suele representar a un parmetro mediante letras griegas, por ejemplo la media poblacional
se representa mediantex y se lee como media poblacional de la variable aleatoria X, la
varianza poblacional se representa mediante 2x y se lee como varianza poblacional de la
variable aleatoriaX.
En trminos prcticos un parmetro es un valor que resulta al emplear los valores que seobtiene de una poblacin.
Ejemplo 2.5
Si al obtener las calificaciones de los 300 alumnos que conforman la poblacin, estos se
promedia, entoncesx = 14.78 es el parmetro correspondiente. Para su clculo se ha
empleado la siguiente expresin, llamada media poblacional:
N
XN
i
i
x
== 1 (2.1)
Obviamente queNtoma el valor 300, para este ejemplo.
Si de estos 300 alumnos 198 son mujeres, entonces la proporcin poblacional de mujeres
representada por x = 0.66 (66%). Para su clculo se ha empleado la siguiente expresin,
llamada proporcin poblacional:
N
XN
i
i
x
== 1 (2.2)
8/3/2019 Est Inf Aplicada
26/166
26
Pero ahora la variable aleatoria se define como:
=alumnosi
alumnasiXi 0
1
En este caso el numerador de la expresin (2.2) es 198 yNtoma el valor 300.
2.7. ESTADSTICO
Se contrapone al parmetro, porque es un valor que se obtiene a partir de los valores
muestrales, se puede obtener media y varianzas mustrales, por ejemplo.
Los estadsticos son variables aleatorias por que estn sujetos a la fluctuacin de la muestra en
relacin al valor poblacional que se asume es constante.
Ejemplo 2.6
Continuando con el ejemplo 2.4, al seleccionar una muestra aleatoria de tamao seis, una vez
identificados los seis alumnos, obtienen las siguientes calificaciones 1x = 13, 2x = 10, 3x =
13, 4x = 14, 5x = 11, 6x = 10 la media obtenida de los seis alumnos es de 11,83, llamada
media muestral y se representa mediante x , cuya expresin es:
n
x
x
n
i
i== 1 (2.3)
El numerador de la expresin (2.3) es la suma de los seis valores, que da 71, que dividido por
6, resulta x = 11,83, es decir en promedio los alumnos han obtenido 11,83 de calificacin en
la prueba de educacin ambiental.
8/3/2019 Est Inf Aplicada
27/166
27
La varianza de esta muestra aleatoria es 2,4722 y se representa mediante 2S , cuya expresin
es:
( )
n
xx
S
n
i
i=
= 1
2
2 (2.4)
Para su clculo, disponemos de la tabla, 2.1, en la que mostramos paso a paso el uso de la
expresin (2.4) sabiendo que x = 11,83:
Tabla 2.1
Clculos para obtener el valor de la varianza (ejemplo 2.6)
Unidadix ( )xxi ( )
2xx
i
1 13 1,17 1,3689
2 10 -1,83 3,3489
3 13 1,17 1,3689
4 14 2,17 4,7089
5 11 -0,83 0,68896 10 -1,83 3,3489
Total 71 0,02* 14,8334
Tericamente:
( ) 01
==
n
i
ixx
El numerador de la expresin (2.4) es la suma del cuadrado de las seis desviaciones de cada
valor que toma la variable, respecto a su media aritmtica, que es igual a 14,8334, que
dividido por 6 es justamente 2,4722.
8/3/2019 Est Inf Aplicada
28/166
28
La raz cuadrada, positiva, de la varianza se llama desviacin estndar o desviacin tpica,
esto es:
2SS += (2.5)
Entonces, usando la expresin anterior (2.5) la desviacin estndar es S = 1,5723.
2.8. DISTRIBUCIN MUESTRAL
Sierra Bravo (1991) anota que la distribucin muestral:
Est formada por estadsticos o valores determinados obtenidos de muestras: medias,varianzas, etc., acompaados de sus respectivas frecuencias relativas o probabilidades,
o de la proporcin de veces que se repiten en el conjunto de todas las muestras
posibles del mismo tamao obtenidas de la poblacin.
De manera ms formal, Tsokos y Milton (1998) anotan que: () la distribucin de
probabilidad del estadstico se llama distribucin muestral.
Ejemplo 2.7
Vamos a obtener la distribucin muestral de las calificaciones obtenidas en la prueba que
mide la educacin ambiental de una poblacin hipottica compuesta por 3 estudiantes y que
toman calificaciones iguales a: 1X = 13, 2X = 11, 3X = 07. Fijamos para una muestra de
tamao 2, en la tabla 2.2 se muestra los posibles resultados de la muestra de tamao 2, as
como su respectiva media muestral:
8/3/2019 Est Inf Aplicada
29/166
29
Tabla 2.2
Resultados de posibles muestras de tamao 2
Muestras
Posibles
Medias muestrales
(media para cada muestra)
13,11 12
13,7 10
11,13 12
11,7 9
7,13 10
7,11 9
Ahora se muestra la distribucin de frecuencias para los valores de la media muestral:
Tabla 2.3
Distribucin muestral de la media muestral
Valor de las medias
muestrales
Frecuencia Frecuencia relativa
9 2 2/6 = 0.33
10 2 2/6 = 0.33
12 2 2/6 = 0.33
La distribucin muestral de la media muestral es la distribucin de frecuencias o de
probabilidad, en este caso, de las frecuencias relativas de todas las medias muestrales
posibles, obtenidas de muestras de tamao 2, de la poblacin de tamao 3.
Por cultura estadstica estudiaremos algunos estadsticos y su distribucin de probabilidad
(distribucin muestral).
8/3/2019 Est Inf Aplicada
30/166
30
2.8.1. MEDIA MUESTRAL
La expresin (2.3), nos indica cmo se obtiene una media muestral. Veamos sus propiedades:
PROPIEDADES DE LA MEDIA MUESTRAL
Si X es una variable aleatoria con esperanza o media poblacional y varianza poblacional
2 , entonces la media muestral, x tiene las siguientes propiedades:
1. ( ) =xE
2. ( ) nxV /2=
3. La desviacin estndar de x , que se representa mediantex
, conocida tambin como
error estndar de la media muestral es igual a n/
4. Sean
XXXX ...,,,,321
una muestra aleatoria de tamao n, de una distribucin con media
poblacional y varianza poblacional 2 . Entonces para n grande, la variable aleatoria:
n
x
/
(2.6)
Se distribuye aproximadamente como una normal estandarizada ( )1,0N . Se considera una
buena aproximacin cuando 30n (Teorema del Lmite Central). De este modo, incluso an
cuando la variable aleatoria X no est normalmente distribuida, podemos aplicarla en la
Inferencia Estadstica.
2.8.2. VARIANZA MUESTRAL
A partir de cada muestra aleatoria de tamao n de X: nxxx ...,,, 21 tambin se puede calcular
la varianza muestral, definida como:
8/3/2019 Est Inf Aplicada
31/166
31
( )=
=n
i
i xxn
s1
22
1
1(2.7)
Cabe precisar, que algunos autores la llaman cuasivarianza.
PROPIEDADES DE LA VARIANZA MUESTRAL
Si X es una variable aleatoria con esperanza y varianza y 2 respectivamente, entonces
para la varianza muestral de tamao n se cumple que:
1. 22 =sE
2. Si X tiene distribucin de probabilidad normal,( )
2
21
sn es una variable aleatoria con
distribucin chi-cuadrado con 1n grados de libertad.
2.8.3.PROPORCIN MUESTRAL
Consideremos una poblacin en la que existe una proporcin de elementos que tienen el
atributo A (o pertenecen a la categora A ).
Si se toma una muestra aleatoria de n elementos, de esa poblacin y se calcula el nmero An
de elementos con el atributo A , entonces:
nnp A= (2.8)
Es la proporcin muestral de los elementos que tienen el atributo A en la muestra, esta
proporcin muestral corresponde a una variable aleatoria.
8/3/2019 Est Inf Aplicada
32/166
32
PROPIEDADES DE LA PROPORCIN MUESTRAL
1. ( ) =pE
2. ( ) ( ) npV /1 =
La desviacin estndar o error estndar de la proporcin muestral, se denota comop y
es igual a n/)1(
3. Para n suficientemente grande, la variable aleatoria:
n
p
Z /)1(
= (2.8.)
Se distribuye aproximadamente como una ( )1,0N . Se considera una buena aproximacin
cuando 30n (Teorema del Lmite Central).
Ejemplo 2.8
En una muestra aleatoria de 15 docentes de educacin secundaria, de la Institucin Educativa
Martn Adn, se les aplico un cuestionario para recoger su opinin sobre el investigador
educativo, se presenta la respuesta de 3 preguntas, de un total de 27:
CUL ES LA DIFERENCIA ENTRE DESVIACIN ESTNDAR
Y ERROR ESTNDAR?
La diferencia es que la desviacin estndar describe la variabilidad de los valores de
una variable, en cambio el error estndardescribe la precisin del estadstico.
8/3/2019 Est Inf Aplicada
33/166
33
Tabla 2.4
Muestra aleatoria de 15 docentes de la Institucin Educativa Martn Adn (Lima)
Docentes Edad (1) Investigador (2) Remuneracin (3)
1 34 1 1
2 38 1 1
3 49 2 1
4 42 1 1
5 35 1 2
6 44 2 1
7 30 1 2
8 36 1 1
9 43 2 1
10 47 2 1
11 39 1 2
12 46 2 1
13 48 2 1
14 36 1 2
15 44 1 1
(1) Edad en aos cumplidos del docente.
(2) La profesin de investigador es profesin atractiva para:
1. Docentes jvenes. 2. Docentes maduros.
(3) El investigador educativo debe ser bien remunerado
1. S. 2. No.
Con esta informacin vamos a mostrar la diferencia entre desviacin estndar y error
estndar.
8/3/2019 Est Inf Aplicada
34/166
34
MEDIA MUESTRAL
La edad en aos cumplidos tiene distribucin con media poblacional, = 38,5 aos y
varianza poblacional,2
= 30 aos2
.
Usando la expresin 2.3 se obtiene x = 40,73 aos, y al usar la expresin 2.7 se obtiene 2s =
33,21 aos2.
Por tanto la desviacin estndar muestral de la edad es: 21,332 == ss = 5,76.
En cambio el error estndar del estadstico media muestral, empleando la propiedad 3, es:
87,3
48,5
15
48,5===
nx
= 1,42 aos
PROPORCIN MUESTRAL
Para la segunda variable, interesa que el docente encuestado indique que la profesin deinvestigador es una profesin atractiva para docentes jvenes ( A ). La muestra aleatoria es
igual a 15 docentes ( )15=n .
En esta poblacin se asume que la proporcin poblacional de docentes que consideran que la
profesin de investigador es una profesin atractiva para docentes jvenes es igual a 0,71
( )71,0= .
De la tabla contamos queAn = 9, es decir, 9 docentes afirman que la profesin de
investigador es una profesin atractiva para docentes jvenes, entonces empleando la
expresin 2.8 se obtiene:
15
9=p = 0,6 (60%)
8/3/2019 Est Inf Aplicada
35/166
35
Esto es, el 60% de docentes encuestados afirman que la profesin de investigador es una
profesin atractiva para docentes jvenes.
El error estndar del estadstico p es:
0137,015
2059,0
15
)29,0(71,0
15
)71,01(71,0)1(===
=
=
np
= 0,1170
2.9. ESTIMACIN
La Inferencia Estadstica se clasifica como: Estimacin y Prueba de Hiptesis de parmetros
estadsticos. En ambos casos hay una poblacin bajo investigacin y generalmente al menos
un parmetro de esta poblacin, al que vamos a representar mediante la letra griega .
Cuando no se tiene una nocin preconcebida sobre el valor de , se desea responder a la
pregunta: Cul es el valor de ?
En este caso el intentar conocer el valor de es en termino estadsticos, estimar el valor de
es decir tratar de conocer el valor del parmetro en trminos prcticos.
Sierra Bravo (1991) anota que:
Estimacin proviene del latn estimatio y significa estimacin, precio y valor que se da
a una cosa. En estadstica es la operacin que mediante la inferencia un parmetro,
utilizando datos incompletos procedentes de una muestra, se trata de determinar el
valor del parmetro. Pero los valores de la muestra estn sujetos al error muestral esto
es a las fluctuaciones de la muestra.
La estimacin de un parmetro puede ser, mediante una:
1. Estimacin puntual.
2. Estimacin mediante intervalos de confianza.
8/3/2019 Est Inf Aplicada
36/166
36
Para cualquiera de estas dos situaciones empleamos el estadstico que como ya se ha
mencionado es una variable aleatoria.
La aproximacin se hace utilizando estadsticos apropiados. A un estadstico empleado para
aproximar o estimar un parmetro de la poblacin se le llama estimador puntual de y se
denota mediante . De este modo por ejemplo, al estimador de la media , se le denotara
por . Una vez que la muestra ha sido tomada y se han hecho algunas observaciones, se
puede obtener el valor numrico del estadstico . A tal nmero se le denomina una
estimacin puntual de . Ntese que hay una diferencia entre los trminos estimador y
estimacin.
Ejemplo 2.9
Consideremos las variables edad en aos cumplidos ( )X y el docente considera que el
investigador educativo debe ser bien remunerado ( )Y , para distinguir entre estimador y
estimacin:
Variable Parmetro Estimador Estimacin
n
x
x
n
i
i== 1
x= = 40,73 aos
X
2 ( )
=
=n
i
i xxn
s1
22
1
1 22 s= = 33,21 aos2
ESTIMADOR: Es el estadstico utilizado para generar una estimacin y es una variable
aleatoria.
ESTIMACIN: Es el valor que toma el estimador.
8/3/2019 Est Inf Aplicada
37/166
37
Y nn
p A= 7333,0 == p (73,33%)
PRUEBA DE HIPTESIS
Proceso mediante el cual, a partir de los valores de una muestra aleatoria se decide si se
rechaza o no el supuesto que plantea el investigador para el parmetro o parmetros de la
poblacin o poblaciones bajo estudio, pero con cierta probabilidad de error (riesgo) por tomar
una decisin.
Ejemplo 2.10
En cierta investigacin, se requiere estudiar el nivel de comprensin lectora en nios de 8
aos de edad, que asisten a Instituciones Educativas estatales y privados, para tal fin se elige
al azar una muestra de alumnos de cada tipo de Institucin Educativa (IE). Se pretende lograr
los siguientes objetivos:
1. Determinar el nivel promedio poblacional del puntaje de la prueba de comprensin lectora
para tipo de IE.
2. Verificar si el nivel promedio poblacional del puntaje de la prueba de comprensin lectora
en nios de IE estatal es diferente de los nios de IE privados.
Explicar cul rama de la Inferencia Estadstica emplear, para lograr cada objetivo.
Solucin
Previamente se requiere identificar:
8/3/2019 Est Inf Aplicada
38/166
38
Poblacin. Se trata de dos poblaciones bajo estudio:
1: Nios de 8 aos de edad, que asisten a Instituciones Educativas Estatales.
2: Nios de 8 aos de edad, que asisten a Instituciones Educativas Privadas.
Muestra. Nios de 8 aos de edad seleccionados aleatoriamente e independiente de cada
poblacin.
Variable Aleatoria. Esta representada medianteXy se define como Puntaje de comprensin
lectora obtenida mediante una prueba especial.
Parmetros. En relacin a la variable aleatoria bajo estudio y considerando que se investiga
para dos tipos de IE, los parmetros son:
1 = Nivel promedio poblacional del puntaje de la prueba de comprensin lectora para nios
de 8 aos de edad que asisten a IE Estatales.
2 = Nivel promedio poblacional del puntaje de la prueba de comprensin lectora para nios
de 8 aos de edad que asisten a IE Privados.
1 = Desviacin estndar poblacional del puntaje de la prueba de comprensin lectora para
nios que asisten a IE Estatales.2 = Desviacin estndar poblacional del puntaje de la prueba de comprensin lectora para
nios que asisten a IE Privadas.
Para lograr el objetivo 1. Se debe emplear la estimacin debido a que se requiere tener un
valor aproximado de 1 y 2 empleando muestras aleatorias que se han obtenido de manera
independiente de cada tipo de institucin educativa.
Para el logro del objetivo 2. Se desea verificar que los promedios poblacionales 1 y 2 son
diferentes a partir de muestras aleatorias, aritmticamente significa: 1 diferente de 2
( 1 2 ) o equivalentemente 1 - 2 = 0.
En este caso se parte del supuesto que no existe diferencias entre el nivel promedio
poblacional del puntaje de la prueba de comprensin lectora para nios que asisten a IE
8/3/2019 Est Inf Aplicada
39/166
39
Estatales y Privados. Por tanto se empleara la prueba de hiptesis estadstica, mediante el cual
se somete a prueba 1 - 2 = 0.
ESTADSTICA PARAMTRICA
Segn Sierra Bravo (1991) es parte de la estadstica que exige determinados requisitos para
emplear en la inferencia estadstica generalmente requiere para su uso el supuesto de
normalidad es decir que las muestras aleatorias se extraen de poblaciones que estn
normalmente distribuidas o aproximadamente.
Ejemplo 2.11
Se desea verificar si el tiempo promedio requerido para resolver un problema sencillo en
nios de 10 aos de edad con secuelas neurolgicas derivadas de hiperbilirubenia al nacer, se
incrementa despus de haber recibido una capacitacin especial para resolver problemas de
ese tipo.
En este caso se debe elegir una muestra aleatoria de la poblacin conformada por nios de
esta poblacin, es decir, nios de 10 aos de edad con secuelas neurolgicas derivadas de
hiperbilirubenia al nacer.
La variable aleatoria bajo estudio X, es el tiempo, en minutos, para resolver un problema
sencillo, cuyo parmetro se define como:
= Tiempo promedio poblacional, en minutos, requerido para resolver un problema
sencillo.
Para estudiar a este parmetro se requiere evaluar a la muestra aleatoria de esta poblacin
antes de la capacitacin especial y despus de la capacitacin especial, es decir los parmetros
para este esquema, sujetos a estudio estadstico son:
8/3/2019 Est Inf Aplicada
40/166
40
1 : Tiempo promedio poblacional, en minutos, requerido para resolver un problema sencillo
antes de la capacitacin.
2 : Tiempo promedio poblacional, en minutos, requerido para resolver un problema sencilloantes de la capacitacin.
En este caso la muestra aleatoria es relacionada, porque a cada unidad de la muestra se le
evala bajo dos condiciones antes, y despus de la capacitacin especial.
Para verificar el supuesto propuesto: la capacitacin especial incrementa el tiempo promedio
requerido para resolver problemas sencillos en nios de esta poblacin a partir de muestrasrelacionadas, se aplica una prueba de hiptesis para someter a prueba: 1 : tiempo, en
minutos, promedio poblacional requerido para resolver un problema sencillo 1 < 2 o
equivalentemente 1 - 2 < 0.
La Estadstica Inferencial nos da la herramienta llamada estadstica para someter a prueba la
diferencia de medias poblacionales empleando muestras relacionadas, cuya aplicacin
requiere que las diferencias de cada par de observaciones (tiempo empleado para resolver unproblema sencillo antes y despus de la capacitacin especial) debe tener distribucin normal
de probabilidad. En este caso se est empleando la estadstica paramtrica debido a que debe
cumplir con el supuesto de normalidad.
ESTADSTICA NO PARAMTRICA
Cuando no se da el supuesto de la normalidad se tiene dos alternativas, una de ellas esaproximar los valores de los datos a una distribucin normal para el cual a una serie de
mtodos y la segunda alternativa es emplear los mtodos de la estadsticas no paramtricas, es
decir, mtodos que no supone nada acerca de la distribucin poblacin muestreada por eso
tambin a los mtodos de la estadstica no paramtrica se le llama de distribucin libre.
Y que son excelentes cuando los tamaos muestrales son pequeos ( 10n ), asimismo estos
mtodos se basan en el anlisis de los rangos de los datos que en las propias observaciones.
8/3/2019 Est Inf Aplicada
41/166
41
Ejemplo 2.12
Considerando el caso anterior si las diferencias muestrales no cumplen con el supuesto de
normalidad, cuya verificacin se realiza con herramientas estadsticas pertinentes, entonces se
recurrir a la estadstica no paramtrica; y que se tratar en el captulo 6.
EJERCICIOS PROPUESTOS
1. Leer atentamente el siguiente resumen, del artculo de investigacin, titulado:
COMPETENCIAS DOCENTES EN LOS PROFESORES DE MEDICINA
DE LA UNIVERSIDAD MICHOACANA DE SAN NICOLS DE HIDALGO1
RESUMEN
Para la identificacin de un grupo de competencias docentes bsicas en los profesores que se
desempean en la licenciatura en medicina en la Facultad de Medicina Dr. Ignacio Chvez,
objetivo fundamental del presente trabajo, se utilizaron mtodos tericos y empricos. Se
aplic una encuesta a una muestra seleccionada de docentes y alumnos. Se emplearon
procedimientos estadsticos para el anlisis de los resultados y se elaboraron tablas. A partir
de la identificacin de las necesidades de aprendizaje de los profesores estudiados, en relacin
con la direccin del proceso enseanza-aprendizaje y los referentes tericos sobre el tema, se
realiz un anlisis integrador para valorar los datos obtenidos, lo que permiti la
caracterizacin de los docentes objeto de investigacin, en relacin con las competencias
docentes bsicas propias de una gestin formativa pertinente. Se tomaron en consideracin los
principios metodolgicos ms actuales acerca de la formacin de recursos humanos en laeducacin superior en sentido general y en particular en la educacin mdica superior.
1 MANZO RODRGUEZ, Lidia, RIVERA MICHELENA, Natacha y RODRGUEZ OROZCO, Alain:Competencias docentes en los profesores de medicina de la Universidad Michoacana de San Nicolsde Hidalgo. Revista Cubana Educativa de Medicina Superior, Abril-Junio, 2006, Vol. 20, N 2.
8/3/2019 Est Inf Aplicada
42/166
42
A partir de este resumen:
1.1. Defina la poblacin.
1.2. Defina la muestra.
1.3. Defina la(s) variable(s) aleatoria(s).
1.4. Plantear un parmetro y su respectivo estadstico, segn su respuesta dada en 3.
2. Leer atentamente el siguiente resumen, del artculo de investigacin, titulado:
PERCEPCIN DE LOS ESTUDIANTES UNIVERSITARIOS
DE SUS PROPIAS HABILIDADES DE INVESTIGACIN2
RESUMEN
El objetivo de esta investigacin fue identificar la percepcin que tienen los estudiantes
universitarios respecto a sus habilidades de investigacin, para lo cual se utiliz un
instrumento llamado Autoevaluacin de habilidades de investigacin (Rivera, Torres,
Garca Gil de Muoz, Salgado, Arango, Caa y Valentn, 2005). Participaron 119 estudiantes
de los cuales73.7 % fueron mujeres y 26.3 % hombres, entre ellos, el 88.2 % se encontraba
realizando estudios de licenciatura y el 11.8 % de posgrado. Se cont con representantes de
cuatro reas de conocimiento: Ciencia y tecnologa, Ciencias humanas, Ciencias econmico
administrativas, y Educacin. La confiabilidad del instrumento aplicado fue alta (Alfa de
Cronbach = 9557). Se encontr que la mayora de los estudiantes asignan calificaciones altasa sus habilidades de investigacin y que por lo general los hombres y las mujeres evalan sus
habilidades de investigacin de manera semejante; cuando aparecen diferencias significativas,
2 Mara Elena RIVERA HEREDIA merivera@bolivar.usb.mx y Claudia Karina TORRESVILLASEOR ambiental@bolivar.usb.mx (Universidad Simn Bolvar).www.usb.edu.mx/investigacion/cif/proyectos/proyecto3/habilidades.doc
8/3/2019 Est Inf Aplicada
43/166
43
son los hombres quienes se asignan puntajes ms altos. Se discuten las diferencias entre los
resultados arrojados por este cuestionario con los de otras estrategias de evaluacin.
En base a este resumen, plantear como sera la aplicacin de la inferencia estadstica bajo el
enfoque de:
2.1. Estimacin de parmetros.
2.2. Prueba de hiptesis de parmetros.
8/3/2019 Est Inf Aplicada
44/166
44
CAPTULO 3
ESTIMACIN DE PARAMTROS
3.1. INTRODUCCIN
Los estimadores son variables aleatorias, veamos un ejemplo cuando se estima la varianza de
una poblacin en base a una nuestra aleatoria difcilmente se puede esperar que el valor de la
varianza que obtenemos, a partir de los valores de la muestra aleatoria extrada, sea
exactamente igual al valor de la varianza poblacional 2 ; pero debemos esperar que ambos,
la varianza muestral y la varianza poblacional, estn lo ms cerca posible; Esto es el valor del
estadstico y el parmetro tomen valores muy similares.
2s 2
Pero el investigador no tiene la posibilidad o no puede disponer de los datos de toda la
poblacin, entonces debe usar las diversas propiedades estadsticas de los estimadores para
que decida cul es el estimador ms apropiado, cul expone a un riesgo menor, cul dar lamayor informacin al costo ms bajo, y as podemos seguir enunciando propiedades ptimas.
Por tanto es necesario revisar o examinar las propiedades de los estimadores.
3.2. PROPIEDADES DE LOS ESTIMADORES
No se tiene la certeza que los estimadores tengan el valor del parmetro, por ello debemos
considera sus propiedades.
3.2.1. INSESGAMIENTO
No hay estimadores perfectos que siempre nos van a dar los valores exactos del parmetro
pero es razonable que un estimador debe hacerlo al menos en el promedio, esto es su valor
8/3/2019 Est Inf Aplicada
45/166
45
esperado debe ser igual al parmetro que se supone estima. Es este caso se dice que es
estimador es insesgado.
Formalmente un estadstico
es un estimador insesgado del parmetro , cuando ( ) =
E
Ejemplo 3.1
El estimador 2s es insesgado de 2 , por que:
( ) 22 =sE
Es decir en promedio el estimador 2s es igual a 2
3.2.2. PROPIEDAD DE EFICIENCIA
Si tenemos que escoger uno entre varios estimadores insesgados de un parmetro dado, se
suele tomar aquel cuya distribucin muestral tenga la varianza ms pequea, por tanto el
estimador seleccionado de varianza ms pequea es eficiente.
Ejemplo 3.2
Sean 21 y , estimadores insesgados de , si sus varianzas respectivas son 21 )( yVV ,
tal que ( ) ( )21 VV < , entonces 1 es un estimador eficiente, porque el estimador 1 tiene
menor varianza que 2 .
3.2.3. CONSISTENCIA
Llamada tambin propiedad lmite de un estimador, se refiere a que cuando n es
suficientemente grande, podemos estar prcticamente seguros de que el error entre el
estimador y el parmetro ser menor que cualquier constante positiva. Formalmente: la
8/3/2019 Est Inf Aplicada
46/166
46
estadstica es un estimador consistente del parmetro si y solo si para cada c>0, se
cumple que:
1lim =
8/3/2019 Est Inf Aplicada
47/166
47
Ejemplo 3.4
Consideremos los datos de la variable edad en aos cumplidos, del ejemplo 2.8, a fin de
calcular la mediana, para ello previamente ordenamos los datos de manera ascendente.
Orden 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Edad 30 34 35 36 36 38 39 42 43 44 44 46 47 48 49
El dato que est en la posicin (orden) 8 es el valor de la mediana, es decir, =Me 42 aos y se
interpreta como, el 50 % de docentes con edades ms bajas tienen como edad mxima 42
aos.
Recuerde que x = 40,73 aos, con respecto a la mediana esta subestimada, esto se debe a la
presencia de edades extremas bajas.
Slo por cuestiones didcticas, vamos a asumir que la edad 49 no es tal, sino es 68, veamos
que ocurre con los valores de la media aritmtica y la mediana, observe ahora los datos
ordenados de manera ascendente son:
Orden 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Edad 30 34 35 36 36 38 39 42 43 44 44 46 47 48 68
Ahora la x = 42 aos y est afectada por el valor extremo alto 58, la media se sobreestima,
pero la mediana no cambia, por que el valor extremo alto no le afecta, ya que para el clculo
de la mediana solo interesa el valor de la variable que est en el lugar o posicin central. Por
tanto la mediana es una estadstica que tiene la propiedad de robustez, por que su valor no se
afecta por valores extremos.
8/3/2019 Est Inf Aplicada
48/166
48
3.3. ESTIMACIN DE PARMETROS MEDIANTE INTERVALOS DE
CONFIANZA
Un intervalo de confianza es un intervalo estimador de un parmetro, cuyos extremos, el
lmite inferior (LI) y lmite superior (LS) son funciones de la muestra, es decir depende
solamente de valores muestrales.
Un intervalo de confianza del parmetro es un intervalo [ ]LSLI, , que incluye al parmetro
con cierto grado de incertidumbre establecido.
Tomando en cuenta la distribucin del estimador, construir un intervalo de confianza es
equivalente a plantear el enunciado probabilstico siguiente:
[ ] = 1LSLIP (3.1)
Donde es un nmero positivo pequeo y el valor ( )1 indica la proporcin esperada de
las veces que el intervalo contendr al parmetro cuando el muestreo se repite un determinado
nmero de ocasiones.
Este valor (1-) se conoce como nivel de confianza. El nivel de confianza se fija de antemano
y su valor debe ser grande. A menudo se usa como valores de como 0.10, 0.05, 0.01, de
esta manera los niveles de confianza son 0.90, 0.95 y 0.99, respectivamente. A diferencia del
estimador puntual que solo plantea un nico valor, el intervalo de confianza brinda un
conjunto de posibles valores, respaldado por la probabilidad de que contenga el valor del
parmetro.
En las siguientes secciones trataremos acerca de la estimacin de parmetros mediante
intervalos de confianza, de forma aplicada, para aquellos lectores que les interese el
fundamento estadstico matemtico, recomendamos revisar en el este captulo bibliografa
correspondiente.
8/3/2019 Est Inf Aplicada
49/166
49
La siguiente teora est basada en el libro de Freund, E. John, et al (2000) y brindamos las
aplicaciones paso a paso a fin que se entienda el uso, el clculo y la interpretacin del
intervalo de confianza.
3.4. INTERVALO DE CONFIANZA PARA ESTIMAR LA MEDIA DE UNA
POBLACIN NORMAL
El parmetro , media poblacional, se obtiene de datos poblacionales, al estudiar una
variable cuantitativa continua.
En general la construccin del intervalo para estimar mediante intervalo a un parmetro,
depende de los siguientes elementos:
1. De la probabilidad o nivel de confianza que elija el investigador, y es la medida de certeza
que consideramos a fin que el intervalo de confianza contenga el valor del parmetro.
2. Del tamao(s) de la(s) muestra(s) aleatoria(s).
3. Del error estndar del estimador.
Las estimaciones mediante intervalos los haremos empleando los datos recolectados de la
muestra aleatoria, que mediante los mtodos de la Estadstica Inferencial, se podr realizar
conclusiones de la poblacin, es decir, los resultados de la muestra se generalizan para la
poblacin, con cierta probabilidad de confianza.
La ventaja de estimar aun parmetro mediante intervalo de confianza es que, para su clculo
se considera la variabilidad del estimador puntual, llamado error estndar, del cual hemos
tratado en la seccin 2.8.
8/3/2019 Est Inf Aplicada
50/166
50
Para interpretar al intervalo de confianza no solo debe realizarse en trminos cuantitativos
sino se debe contextualizar y ser conscientes que la calidad de los datos, es decir su
pertinencia, respecto a los objetivos para lograr en la investigacin o las hiptesis a
verificarse, harn que los clculos obtenidos no sean fros, por el contrario estar indicando
alguna propiedad respecto a la poblacin.
3.4.1. CUANDO LA VARIANZA POBLACIONAL2 ES CONOCIDA
Si x es la media de una muestra aleatoria de tamaon obtenida de una poblacin normal con
varianza poblacional2
conocida, entonces:
+
nzx
nzx
2/2/ , (3.1)
Es un intervalo de confianza del ( )1 100 % para la media poblacional .
RECUERDE
Un intervalo de confianza o estimacin mediante intervalo de confianza es un conjunto
de valores que probablemente contiene al valor del parmetro (expresin 3.1)
RECUERDE
Si los datos no se han recolectado adecuadamente, sin el debido cuidado, pueden
resultar intiles, aunque se el tamao de la muestra sea grande.
8/3/2019 Est Inf Aplicada
51/166
51
En este caso la distribucin de probabilidad normal es el soporte para realizar la inferencia,
mediante la estimacin por intervalo de confianza.
Sus lmites son:
Lmite inferior :n
zx
2/
Lmite superior :n
zx
2/+
Ambos lmites dependen de la probabilidad de confianza que elija el investigador y del error
estndar de la media muestral, ver seccin 2.8.1.
Los valores de los lmites contienen al estimador puntual x , al valor de este estimador para
obtener los lmites inferior y superior se disminuye y adicionan
z
2/ respectivamente.
La amplitud o rango del intervalo de confianza es:n
z
2/2 , esto significa que los posibles
valores del parmetro , de una poblacin normal, basado en una muestra aleatoria de
tamao n y cuando la varianza poblacional 2 es desconocida depende de dos factores: la
probabilidad de confianza que elija el investigador y del error estndar del estimador puntual
de , que es la x , esto es,n
. Como tambin del valor del valor del estimador puntual del
parmetro.
En el siguiente grfico, se muestra la particin de la distribucin normal estandarizada para
obtener un intervalo de confianza al ( )1 100 %.
8/3/2019 Est Inf Aplicada
52/166
52
Grfico N 3.1
Particin de la distribucin normal estandarizada para obtener
un intervalo de confianza para
El valor 2/z es la cuantila (abscisa) de la distribucin normal estandarizada, tal que la
probabilidad hacia la derecha es 2/ .
Esta y el resto de cuantilas que se requieren para el clculo de los intervalos de confianza, los
obtenemos mediante el software Excel. En el apndice se muestra la forma de obtenerlos.
Ejemplo 3.5
El director de la EAP de Educacin elige al azar a 16 alumnos de pregrado que estn
matriculados en el curso Estadstica Aplicada a la Educacin y que asisten regularmente, con
el objetivo de conocer si han comprendido el uso y la importancia de la estimacin de
parmetros mediante intervalo de confianza. Las calificaciones obtenidas mediante una
prueba pertinente (escala vigesimal) tiene distribucin normal con 2 = 7,43. El director
desea saber cunto es la calificacin promedio para todos los alumnos que estn matriculados
en el curso mencionado. Las calificaciones obtenidas de los 16 alumnos son:
17 13 14 15 13 17 13 8 12 16 15 10 11 13 15 9
)1,0(N
8/3/2019 Est Inf Aplicada
53/166
53
Solucin
Primero identificamos la variable aleatoria:
X: Calificacin de la prueba que mide la comprensin del uso y la importancia de la
estimacin de parmetros mediante intervalo de confianza.
Esta variable aleatoria tiene distribucin normal con parmetros:
:Calificacin promedio poblacional
2 = 7,43
El nivel de confianza que se emplear es 0.95 o del 95%
Para estimar empleamos la expresin 3.1, los valores de la abscisa normal estandariza se
presenta en el siguiente grfico.
Los valores requeridos son:x = 13,2 (estimador puntual de ), 2/z = 1,96 y 43,7
2 == = 2,73.
Los lmites del intervalo de confianza para son:
Lmite inferior:n
zx
2/ = 86,1134,12,1316
73,296,12,13 ==
Lmite superior:n
zx
2/+ = 54,1434,12,1316
73,296,12,13 =+=
+
8/3/2019 Est Inf Aplicada
54/166
54
Por tanto se espera con un 95 % de probabilidad de confianza, que la calificacin promedio
para todos los alumnos que estn matriculados en el curso Estadstica Aplicada a la Educacin
y que asisten regularmente, tome valores entre 11,86 y 14,54.
3.4.2. CUANDO LA VARIANZA POBLACIONAL, 2 , SE DESCONOCE
Si x es la media de una muestra aleatoria de tamaon obtenida de una poblacin normal con
varianza poblacional 2 desconocida, entonces:
+
n
stx
n
stx 2/2/ , (3.2)
Es un intervalo de confianza del ( )1 100 %, para la media poblacional .
En este caso la distribucin de probabilidad t-Studentes el soporte para realizar la inferencia,
mediante la estimacin por intervalo de confianza. Sus lmites son:
Lmite inferior:n
stx 2/
Lmite superior:n
stx 2/+
Ambos lmites dependen de la probabilidad de confianza que elija el investigador y del error
estndar de la media muestral, pero cuando la varianza poblacional, 2 , se desconoce, por
tanto se usa como estimador de 2 a la cuasivarianza, seccin 2.8.2:
( )=
=n
i
i xxn
s1
22
1
1
La desviacin estndar muestral es: 2ss =
8/3/2019 Est Inf Aplicada
55/166
55
Los valores de los lmites contienen al estimador puntual x , al valor de este estimador para
obtener los lmites inferior y superior se disminuye y adicionan
st 2/ respectivamente.
En el siguiente grfico, se muestra la particin de la distribucin t-Studentpara obtener un
intervalo de confianza al ( )1 100 %.
Grfico N 3.2
Particin de la distribucint-Student para obtener
un intervalo de confianza para
El valor 2/t es la cuantila (abscisa) de la distribucin t-Studentcon n-1 grados de libertad, tal
que la probabilidad hacia la derecha es 2/ .
Ejemplo 3.6
Como parte de la evaluacin de la calidad del aprendizaje en escolares del segundo grado de
primaria de Instituciones Educativas estatales, el equipo evaluador ha elegido al azar a 20
nios de esta poblacin. Se les aplico una prueba de aritmtica que consta de 30 problemas
para este nivel, los autores de la prueba indican los escolares de este grado escolar debe
emplear en promedio 40 minutos, para resolver estos problemas.
)1( nt
2/t 2/t
8/3/2019 Est Inf Aplicada
56/166
56
El equipo evaluador desea estimar el tiempo promedio que emplean todos los nios de este
nivel de estudios para resolver esta prueba, si se sabe que el tiempo tiene distribucin normal.
Los tiempos empleados por los alumnos son:
50 48 48 55 40 52 57 55 47 46
43 49 51 50 53 48 50 46 43 45
Solucin
Primero identificamos la variable aleatoria:
X: Tiempo empleado para resolver los 30 problemas.
Esta variable aleatoria tiene distribucin normal con parmetros:
:Tiempo promedio poblacional empleado para resolver los 30 problemas.
2 : Varianza poblacional del tiempo empleado para resolver los 30 problemas.
No se dispone del valor de 2 .
El nivel de confianza que se emplear es 0.95 o del 95%.
Para estimar empleamos la expresin 3.2, los valores de la abscisa de la distribucin t-
Studentcon n-1 = 19 grados de libertad se presenta en el siguiente grfico, que corresponde a
la participacin de la distribucin t-Student.
Los valores requeridos son:
x = 48,8 2/t = 2,093 y 01,192 == ss = 4,36.
- 093,2 093,2
)19(t
8/3/2019 Est Inf Aplicada
57/166
57
Los lmites del intervalo de confianza son:
Lmite inferior:n
stx 2/ = 76,4604,28,48
20
36,4093,28,48 ==
Lmite superior:nstx 2/+ = 84,5004,28,482036,4093,28,48
=+=
+
Por tanto, se espera con un 95% de probabilidad de confianza que el tiempo promedio
poblacional empleado para resolver los 30 problemas, est comprendido entre 46,76 y 50,84
minutos. La estimacin intervlica indica que esta poblacin est fuera de control, por que la
norma indica que el tiempo promedio poblacional empleado es de 40 minutos, valor que no
pertenece al intervalo de confianza obtenido.
3.5. INTERVALO DE CONFIANZA PARA ESTIMAR LA VARIANZA
POBLACIONAL 2 DE UNA POBLACIN NORMAL
Si 2s es la varianza de una muestra aleatoria de tamaon obtenida de una poblacin normal,
entonces:
2
2/
2
22/1
2
)1(,)1(
snsn (3.3)
Es un intervalo de confianza del ( )1 100 %, para la varianza poblacional 2 .
En este caso la distribucin de probabilidad Chi-cuadrado o Ji-cuadrado, es el soporte para
realizar la inferencia, mediante la estimacin por intervalo de confianza; sus lmites son:
Lmite inferior: 22/1
2)1(
sn
Lmite superior: 22/
2)1(
sn
Ambos lmites dependen de la probabilidad de confianza que elija el investigador y del error
estndar estimado de la varianza muestral 2s .
8/3/2019 Est Inf Aplicada
58/166
58
Los valores de los lmites contienen al estimador puntual. En el siguiente grfico, se muestra
la particin de la distribucin Chi-cuadrado para obtener un intervalo de confianza al ( )1
100%, para 2 .
Grfico N 3.3
Particin de la distribucin Chi cuadradopara obtener
un intervalo de confianza para 2
Fuente: virtual.uptc.edu.co/.../libro/node104.htm (23.05.06)
El valor2
2/ es la cuantila (abscisa) de la distribucin Chi cuadrado tal que la probabilidad
acumulada es igual a 2/ y el valor 2 2/1 es la cuantila (abscisa) de la distribucin Chi
cuadrado tal que la probabilidad acumulada es igual a 2/1 , pero la distribucin Chi
cuadrado tiene n-1 grados de libertad.
Ejemplo 3.7
Considerar el ejemplo 3.6, para estimar mediante intervalo de confianza a 2 , varianza
poblacional del tiempo empleado para resolver los 30 problemas. Interprete.
Solucin
El nivel de confianza que se emplear es 0.95 o del 95 %. Para estimar 2 , mediante
intervalo de confianza usamos la expresin 3.3; Los valores de la abscisa de la distribucin
chi cuadrado con n-1 = 19 grados de libertad se presenta en el siguiente grfico:
8/3/2019 Est Inf Aplicada
59/166
59
Los valores de requeridos, para calcular el intervalo de confianza son:
01,192 =s ; 2025,0
= 8,91 =2975,0
32,85.
Los lmites son:
Lmite inferior: 99,1085,32
)01,19(19)1(2
2/1
2
==
sn
Lmite superior: 54,4091,8
)01,19(19)1(2
2/
2
==
sn
Por tanto se espera con un 95% de probabilidad de confianza, que la varianza poblacional del
tiempo empleado para resolver los 30 problemas, est comprendido entre 10,99 y 40,54
minutos2.
3.5. INTERVALO DE CONFIANZA PARA ESTIMAR LA PROPORCIN
POBLACIONAL DE UNA POBLACIN BINOMIAL
Si p es una proporcin de una muestra aleatoria n (grande) obtenida de una poblacin
binomial con parmetro , entonces:
+
n
ppzp
n
ppzp
)1(,
)1(2/2/ (3.4)
Es un intervalo de confianza del ( )1 100%, para estimar la proporcin poblacional .
2)19(
8,91 32,85
8/3/2019 Est Inf Aplicada
60/166
60
Siendo p : Es el estimador puntual de , expresin 2.8 de la seccin 2.8.3.
En este caso la distribucin de probabilidad normal estandarizada es el soporte para realizar la
inferencia, mediante la estimacin por intervalo de confianza.
Sus lmites son:
Lmite inferior:n
ppzp
)1(2/
Lmite superior:n
ppzp
)1(2/
+
Ambos lmites dependen de la probabilidad de confianza que elija el investigador y del error
estndar estimado de la proporcin muestral.
Los valores de los lmites contienen al estimador puntual p , al valor de este estimador para
obtener los lmites inferior y superior se disminuye y adicionan
ppz
)1(2/
respectivamente.
En el siguiente grfico, se muestra la particin de la distribucin normal estandarizada para
obtener un intervalo de confianza al ( )1 100%, para la proporcin poblacional.
Grfico N 3.4
Particin de la distribucin normal estandarizada
para obtener un intervalo de confianza para
)1,0(N
8/3/2019 Est Inf Aplicada
61/166
61
El valor 2/z es la cuantila de la abscisa normal estandarizada tal que la probabilidad hacia la
derecha es 2/ .
Ejemplo 3.8
Se aplica un cuestionario que mide la actitud hacia la autoevaluacin de la calidad educativa a
una muestra aleatoria de alumnos de la Facultad de Ciencias Matemticas. De un total de 364
alumnos, 247 evidencian actitud positiva hacia la autoevaluacin.
Se solicita que estime la proporcin de alumnos de esta Facultad con actitud positiva hacia la
autoevaluacin de la calidad educativa.
Solucin
Primero identificamos la variable aleatoria:
X: Actitud hacia la autoevaluacin de la calidad educativa, siendo la clase de inters actitud
positiva.
Esta variable aleatoria tiene distribucin binomial con parmetros n grande (n = 364) y :
Proporcin poblacional de alumnos de la Facultad de Ciencias Matemticas, con actitud
positiva hacia la autoevaluacin de la calidad educativa.
El nivel de confianza que se emplear es 0.90 (90%).
Para estimar empleamos la expresin 3.4, los valores de la abscisa de la distribucin
normal estandarizada se presenta en el siguiente grfico:
8/3/2019 Est Inf Aplicada
62/166
62
Los valores requeridos, para el clculo del intervalo de confianza correspondiente son:
== 364
247p 0,6786, 2/z = 1,645.
Reemplazando en la expresin 3.4, se obtiene lo siguiente:
Lmite inferior:n
ppzp
)1(2/
=
6541,00245,06786,0364
)6786,01(6786,0645,16786,0 ==
Lmite superior:n
ppzp
)1(2/
+ =
7031,00245,06786,0364
)6786,01(6786,0645,16786,0 =+=
Por tanto se espera que con un 90% de probabilidad de confianza, que la proporcin de
alumnos de esta Facultad con actitud positiva hacia la autoevaluacin de la calidad educativa
est comprendida entre 0,6541 (65,41%) y 0,7031 (70,31%).
8/3/2019 Est Inf Aplicada
63/166
63
3.5. INTERVALO DE CONFIANZA PARA ESTIMAR DIFERENCIA DE MEDIAS
POBLACIONALES, 21 , DE POBLACIONES NORMALES
Cuando en una investigacin deseamos comparar a dos grupos o poblaciones, empleando losvalores de una variable aleatoria, estamos realizando anlisis de diferencias.
Estas poblaciones pueden ser independientes o relacionadas, por tanto las muestras aleatorias
que servirn para realizar inferencias mediante intervalos de confianza tambin estn en ese
sentido, veamos.
3.5.1. USANDO MUESTRAS INDEPENDIENTES
Proponemos el siguiente caso, el coordinador del curso Ciencia y Ambiente a fin de mejorar
el rendimiento de sus alumnos dispone de dos mtodos de enseanza:
1. Resolucin de problemas.
2. Discusin de casos.
El coordinador desea saber con cul mtodo los alumnos, de la Institucin educativa donde
trabaja, obtienen mejor rendimiento; entonces realiza el estudio entre alumnos del tercer grado
de secundaria de dos secciones. A una seccin le asigna aleatoriamente el mtodo resolucin
de problemas y a la otra seccin, el mtodo discusin de casos.
Es obvio que cada mtodo de enseanza se desarrolla independientemente uno del otro. A
este tipo de diseo se le llama de muestras independientes y la comparacin se realiza en base
al rendimiento de los dos grupos.
El rendimiento de los alumnos se mide mediante una prueba diseada por el coordinador, que
debe ser vlida y confiable.
8/3/2019 Est Inf Aplicada
64/166
64
3.5.1.1.CUANDO LAS VARIANZAS POBLACIONALES 21 Y22 SON
DESCONOCIDAS PERO 2221 =
Si 1x y 2x son las medias de muestras aleatorias independientes de tamaos 1n y 2n de
poblaciones normales con varianzas poblacionales 21 y22 , conocidas e iguales, entonces:
( )21
2/2111
nnStxx p + (3.5)
Es un intervalo de confianza del ( ) %1001 de probabilidad de confianza, para la diferencia21 .
Donde:
( ) ( )
2
11
21
222
2112
+
+=
nn
snsnS
p(3.6)
Es el estimador insesgado de la varianza comn.
El valor 2/t es la cuantila (abscisa) de la distribucin t-Student con 221 + nn grados de
libertad, tal que la probabilidad hacia la derecha es 2/ . La particin de la distribucin de
probabilidad t-Studentes similar a la del grfico 3.2.
Esto es la distribucin de probabilidad t-Studentes el soporte para obtener los lmites y son:
Lmite inferior: ( )21
2/2111
nnStxx p +
Lmite superior: ( )21
2/2111nn
Stxx p ++
8/3/2019 Est Inf Aplicada
65/166
65
Ejemplo 3.9
En la enseanza es muy importante emplear las Tecnologas de la Informacin y las
Comunicaciones (TICs) porque brinda resultados positivos en el aprendizaje de los alumnos,
un investigador desea mostrar las ventajas para la enseanza de Historia del Per frente a la
enseanza tradicional (expositor, pizarra, tiza y papelgrafo).
Empleando las TICs no solo requiere los conocimientos mnimos sobre el hardware y el
software a emplearse, sino buscar informacin relevante para la enseanza, crear materiales,
digitales o multimedia para la docencia y la investigacin del curso que se imparte.
Un equipo de investigadores ha desarrollado un software, PER, para la enseanza de
Historia del Per, para los alumnos del cuarto grado de secundaria. Para verificarlo se
selecciona una muestra aleatoria de tamao 40, con caractersticas similares. Veinte escolares
se asignan al azar al grupo control (enseanza tradicional) y los otros veinte al grupo
experimental (enseanza con el software PER), en ambos grupos ensean docentes que han
sido debidamente capacitados y desarrollan el mismo contenido temtico. Al final del curso se
aplica una prueba que mide el nivel de conocimientos sobre Historia del Per a cada grupo y
se obtienen las siguientes calificaciones.
13 9,5 12 13 11,5 12 9,5 12 10 13,5Grupo control
11 13,5 11,5 10,5 9 12 8 12 10,5 15
14,5 13,5 16,5 17 12 13,5 14 17,5 14 16Grupo experi-
mental 17,5 15 15,5 13 17 15 15,5 16 14,5 14,5
Calcule e interprete la estimacin de la diferencia de calificaciones promedios poblacionales
para los dos grupos, sabiendo que las calificaciones para cada grupo tiene distribucin
normal, con varianzas desconocidas e iguales.
Solucin
X: Calificacin de la prueba que mide el nivel de conocimientos sobr