Download HIPOTESIS Una hipótesis estadística es un supuesto acerca del

Survey
yes no Was this document useful for you?
   Thank you for your participation!

* Your assessment is very important for improving the work of artificial intelligence, which forms the content of this project

Document related concepts
no text concepts found
Transcript
HIPOTESIS
Una hipótesis estadística es un supuesto acerca del valor de un parámetro de una
población determinada. Este supuesto debe comprobarse con la información suministrada
por una muestra aleatoria obtenida de dicha población.
Cuando se realiza una prueba de hipótesis, se plantean dos hipótesis que deben ser
mutuamente excluyentes; una es la hipótesis nula que se nota como H0 y la otra es la
hipótesis alternativa que se nota como H1 .
Se debe establecer un criterio o regla de decisión según la cual no se rechace la hipótesis
nula o se rechace. Si se rechaza la hipótesis nula (H0 ) se acepta hipótesis alternativa (H1
). Para establecer esta regla de decisión la distribución de probabilidad se divide en dos
categorías mutuamente excluyentes: la que lleva al rechazo de H0 , es decir está en la
zona de rechazo y la que lleva al no rechazo de H0 , es decir, está en la zona de no
rechazo.
Hipótesis tipo I tipo II
Debido a que se está trabajando con una muestra aleatoria, cuando se realiza una prueba
de hipótesis se pueden cometer dos tipos de errores. La hipótesis nula (H0 ) es en
realidad verdadera, pero debido a que los datos muestrales parecen ser inconsistentes
con ella, se la rechaza (ERROR TIPO I) y la probabilidad de cometer un error tipo I se
llama nivel de significancia ( ). Puesto que cuando se comete un error tipo I, seguiríamos
una acción errónea, se puede definir el nivel de significancia como la probabilidad de
decidirnos por H1 dado que H0 es verdadera.
Por otro lado, podemos no rechazar H0 siendo en realidad falsa, a este error se le llama
ERROR TIPO II.
FORMULACION DE HIPOTESIS
El primer paso en la prueba de hipótesis es el planteamiento de las hipótesis, lo que en
algunos casos no es una tarea fácil.
Hay tres tipos de hipótesis, a saber:
- Prueba de hipótesis a dos colas
H0: = k
H1:
k
- Prueba de hipótesis a una cola superior
H0 : = k
ó
H0:
k
H1 : > k
ó
H1 : > k
- Prueba de hipótesis a una cola inferior
H0 : = k
ó
H0 :
k
H1 : < k
ó
H1 : < k
Nótese que las hipótesis siempre se plantean para un parámetro .
Una vez establacidas las hipótesis, se selecciona el nivel de significancia o márgen de
error ( ) el que generalmente se fija entre el uno y el diez por ciento.
El tercer paso es la estadística a probar o estadística de trabajo, la cual depende de la
distribución en el muestreo del estimador con el que se esté trabajando y de los
supuestos correspondientes a la población y al tamaño de la muestra. Cuando se realizan
los cálculos siempre se supone que la hipótesis nula (H0) es cierta.
El cuarto paso es establecer la regla de decisión, la cual depende de la distribución de
probabilidad de la estadística a probar, del nivel de significancia ( ) y de la hipótesis
alternativa (H1).
Finalmente se toma la decisión de no rechazar la hipótesis nula o rechazarla.
Prueba de hipótesis para la media
El promedio aritmético poblacional es un indicador muy importante, por lo tanto,
frecuentemente se desea probar si dicho promedio ha permanecido igual, ha aumentado
o ha disminuído. A través de la prueba de hipótesis se determina si la media poblacional
es significativamente mayor o menor que algún valor supuesto.
Hipótesis
Se puede plantear uno de los siguientes tres tipos de hipótesis:
- Prueba de hipótesis a dos colas
H0 : = k
H1 :
k
- Prueba de hipótesis a una cola superior
H0 : = k
ó
H0 :
k
H1 : >k
ó
H1 : > k
- Prueba de hipótesis a una cola inferior
H0 : = k
ó
H0 :
k
H1 : < k
ó
H1 : < k
En las distribuciones en el muestreo se vió que para el caso de la media, hay tres
situaciones, por consiguiente la estadística de trabajo a utilizar depende de los supuestos
de la población y del tamaño de la muestra.
Prueba de hipótesis para la media si la población de donde se obtiene la muestra
tiene distribución normal con conocida.
La estadística de trabajo a usar corresponde a la expresión (1.6):
(3.1)
Donde: es el valor que se está suponiendo en la hipótesis nula (H0).
REGLA DE DECISION
- Si se ha planteado la hipótesis alternativa como: H1 : k se tiene una prueba de
hipótesis a dos colas, por lo tanto, el nivel de significancia ( ) se divide en dos partes
iguales, quedando estos valores en los extremos de la distribución como se aprecia en la
figura 3.1
Figura 3.1 Regla de decisión para una prueba de hipótesis a dos colas.
y
pertenecen a una distribución normal estándar. Si el valor de la estadística de
trabajo (Zx) está entre
y
no se rechaza la hipótesis nula, en caso contrario se
rechaza H0 lo cual implica aceptar H1. Es decir:
- Si se ha planteado la hipótesis alternativa como:
H1 : > k, se tiene una prueba de hipótesis a una cola superior, quedando el nivel de
significancia ( ) en la parte superior de la distribución, como se aprecia en la figura 3.2
Figura 3.2 Regla de decisión para una prueba de hipótesis a una cola superior.
pertenece a una distribución normal estándar. Si el valor de la estadística de trabajo
(Zx) es menor que
no se rechaza la hipótesis nula, en caso contrario se rechaza H0 lo
cual implica aceptar H1. Es decir,
Si se ha planteado la hipótesis alternativa como:
H1 : < k, se tiene una prueba de hipótesis a una cola inferior, quedando el nivel de
significancia ( ) en la parte inferior de la distribución, como se aprecia en la figura 3.3
Figura 3.3 Regla de decisión para una prueba de hipótesis a una cola inferior.
Z pertenece a una distribución normal estándar. Si el valor de la estadística de trabajo
(Zx) es mayor que Z no se rechaza la hipótesis nula, en caso contrario se rechaza H0 lo
cual implica aceptar H1. Es decir,
EJEMPLO
Un proceso manufacturero usado por una fábrica durante los últimos años da una
producción media de 100 unidades por hora con una desviación estándar de 8 unidades.
Se acaba de introducir en el mercado una nueva máquina para realizar ese tipo de
producto. Aunque es muy cara comparada con la que está ahora en uso, si la media de
producción de la nueva máquina es de más de 150 unidades por hora, su adopción daría
bastantes beneficios.
Para decidir si se debiera comprar la nueva máquina, a la gerencia de la fábrica se le
permite hacer un ensayo durante 35 horas, hallándose un promedio de 160 unidades por
hora. Con ésta información qué decisión se debe tomar si se asume un nivel de confianza
del 99 por ciento.
Solución .
Según el enunciado, solo se compra la máquina si la producción es de mas de 150
unidades por hora, por lo tanto las hipótesis son:
H0 : = 150
H1 : > 150
Para elegir la estadística de trabajo se tiene en cuenta que se conoce la varianza
poblacional, por lo tanto se usa la expresión 3.1
por el planteamiento de la hipótesis alternativa se trabaja a una cola superior. En la
distribución normal, con una confiabilidad del 99 por ciento el valor de Z es 2,33. como
puede observarse en la figura 3.4, la estadística de trabajo está en la zona de rechazo de
la hipótesis nula, por lo tanto, se acepta que la producción promedio por hora es superior
a las 150 unidades y asumiendo un riesgo del 1 por ciento se puede comprar la nueva
máquina.
Prueba de hipótesis para la media si se selecciona una muestra aleatoria de tamaño
n 30 de una población con cualquier distribución.
La estadística de trabajo a usar es la expresión (1.7):
REGLA DE DECISION
Es la misma que en el caso anterior y depende en todo caso de la hipótesis alternativa.
EJEMPLO
La duración promedio de las llantas producidas por una fábrica de llantas, según
experiencias registradas es de 46.050 kms. Se desea probar si el promedio poblacional
ha cambiado; para tal efecto se toma una muestra aleatoria de 60 llantas y se obtiene una
duración promedio de 45.050 kms. con una desviación estándar de 3.070 kms.
Solución
H 0 : = 46.050
H1 :
46.050
Teniendo en cuenta que el tamaño de la muestra es grande, como estadística de trabajo
se utiliza la expresión 3.2
Por la hipótesis alternativa, la regla de decisión es a dos colas. La tabla a utilizar es la de
la distribución normal. Asumiendo un nivel de confianza del 95 por ciento, los
correspondientes valores de Z son -1,96 y 1,96. Como puede observarse en la figura 3.5,
el valor de la estadística de trabajo está en la zona de rechazo de la hipótesis nula, por
consiguiente, con una confiabilidad del 95 por ciento se acepta que la duración promedio
de las llantas ha cambiado.
HIPOTESIS DE VARIANZAS
Regla de decisión para una prueba de hipótesis
Si de dos poblaciones con distribución normal se seleccionan dos muestras aleatorias
independientes de tamaños n1 y n2 , se puede comparar la homogeneidad o variabilidad
de dichas poblaciones a través de una prueba de hipótesis para el cociente de varianzas.
Cuando se planteen las hipótesis debe quedar en el numerador la población cuya muestra
tenga mayor varianza. Es decir que la población 1 será la que tenga mayor varianza
muestral.
Hipótesis
Se puede plantear uno de los siguientes tres tipos de hipótesis:
- Prueba de hipótesis a dos colas
H0 :
=
H1 :
ó
ó
H0 :
H1 :
/
/
=1
1
- Prueba de hipótesis a una cola superior
H0 :
=
ó
H0 :
/
1
H1 :
>
ó
H1 :
/
>1
- Prueba de hipótesis a una cola inferior
H0 :
=
ó
H0 :
/
1
H1 :
<
ó
H1 :
/
<1
La estadística de trabajo es la expresión (1.15)
(3.8)
PRUEBA DE HIPOTESIS DE VARIANZA
REGLA DE DECISION
Si se ha planteado la hipótesis alternativa como:
H1 :
ó H1 : /
1 se tiene una prueba de hipótesis a dos colas, por lo tanto, el
nivel de significancia ( ) se divide en dos partes iguales, quedando estos valores en los
extremos de la distribución como se aprecia en la figura 3.8
y
pertenecen a una distribución F con (n1 -1) grado de libertad en el numerador y
(n2-1) grado de libertad en el denominador. Si el valor de la estadística de trabajo (T) está
entre
y
no se rechaza la hipótesis nula, en caso contrario se rechaza H0 lo cual
implica aceptar H1 . Es decir, si
<T<
no se rechaza H0 .
- Si se ha planteado la hipótesis alternativa como:
H1 : > ó H1 : / > 1 , se tiene una prueba de hipótesis a una cola superior,
quedando el nivel de significancia ( ) en la parte superior de la distribución, como se
aprecia en la figura 3.9
Z 1- a pertenece a una distribución F con (n 1 -1) grado de libertad en el numerador y (n 2
-1) grado de libertad en el denominador. Si el valor de la estadística de trabajo (T) es
menor que Z 1- a no se rechaza la hipótesis nula, en caso contrario se rechaza H o lo cual
implica aceptar H 1 . Es decir, si T < Z 1- a no se rechaza H o .
- Si se ha planteado la hipótesis alternativa como:
H1 : < ó H1 : / < 1 , se tiene una prueba de hipótesis a una cola inferior,
quedando el nivel de significancia ( ) en la parte inferior de la distribución, como se
aprecia en la figura 3.10
Z a pertenece a una distribución F con (n1 -1) grado de libertad en el numerador y (n2 -1)
grado de libertad en el denominador. Si el valor de la estadística de trabajo (T) es mayor
que Z a no se rechaza la hipótesis nula, en caso contrario se rechaza H o lo cual implica
aceptar H 1 . Es decir, si T > Z a no se rechaza H0 .
EJEMPLO
Dos fuentes de materias primas están siendo consideradas. Ambas fuentes parecen tener
características similares, pero no se está seguro de su homogeneidad. Una muestra de 10
grupos de la fuente A produce una varianza de 250 y una muestra de 11 grupos de la
fuente B produce una varianza de 195. Con base en ésta información se puede concluir
que la varianza de la fuente A es significativamente mayor que la de la fuente B?. Asuma
un nivel de confianza del 99 por ciento.
Solución
H0:
A=
B
H1 :
A>
B
Con un nivel de confianza del 99 por ciento, en la tabla de la distribución F con 9 grados
de libertad en el numerador y 10 grados de libertad en el denominador, se obtiene un
valor para Z de 4,94. Como puede observarse en la figura 3.12, el valor de la estadística
de trabajo está en la zona de no rechazo de la hipótesis nula, por lo tanto, con una
confiabilidad del 99 por ciento, no se puede rechazar que la variabilidad de las dos
fuentes de materia prima es igual.
Regla de decisión para una prueba de Hipótesis a una cola superior
Se tienen dos poblaciones y se toman muestras aleatorias independientes de tamaños n 1
y n 2 , se puede comparar el comportamiento de dichas poblaciones a través de los
promedios.
Hipótesis
Como en los casos anteriores se puede plantear uno de los siguientes tres tipos de
hipótesis:
- Prueba de hipótesis a dos colas
H0 :
=
H1 :
ó
ó
H0 :
H1 :
-
=k
k
- Prueba de hipótesis a una cola superior
H0 :
=
ó
H0 :
-
k
H1 :
>
ó
H1 :
-
>k
- Prueba de hipótesis a una cola inferior
H0 :
=
ó
H0 :
-
k
H1 :
<
ó
H1 :
-
<k
La estadística de trabajo depende de las características de las poblaciones y del tamaño
de las muestras.
Prueba de hipótesis para la diferencia de proporciones
Cuando se tienen dos poblaciones y se han tomado muestras aleatorias de tamaños n 1 y
n 2, para observar una característica o cualidad, se puede comparar el comportamiento
de dicha característica en las poblaciones a través de la diferencia de proporciones.
Hipótesis
Como en los casos anteriores se puede plantear uno de los siguientes tres tipos de
hipótesis:
- Prueba de hipótesis a dos colas
H0 : 1 = 2 ó H0 : 1 - 2 = k
H1 : 1
2 H1 : 1 - 2 k
- Prueba de hipótesis a una cola superior
H0 : 1 = 2 ó H0 : 1 - 2 k
H1 : 1 > 2 H1 : 1 - 2 > k
- Prueba de hipótesis a una cola inferior
H0 : 1 = 2 ó H0 : 1 - 2 k
H1 : 1 < 2 H1 : 1 - 2 < k
La estadística de trabajo es la expresión 1.14:
(3.14)
REGLA DE DECISION
Como en los casos anteriores depende del tipo de hipótesis que se haya planteado.
- Si se ha planteado la hipótesis alternativa como:
H1 : 1 2 ó H1 : p 1 - p 2 ¹ k se tiene una prueba de hipótesis a dos colas, por lo tanto,
el nivel de significancia ( ) se divide en dos partes iguales, quedando estos valores en
los extremos de la distribución como se aprecia en la figura 3.1
y
pertenecen a una distribución Normal estándar. Si el valor de la estadística de
trabajo (Zp1-p2 ) está entre
y
no se rechaza la hipótesis nula, en caso contrario se
rechaza H0 lo cual implica aceptar H1 . Es decir, si
< Zp1-p2 <
no se rechaza H0 .
- Si se ha planteado la hipótesis alternativa como:
H1 : 1 > 2 ó H1 : 1 - 2 > k, se tiene una prueba de hipótesis a una cola superior,
quedando el nivel de significancia ( ) en la parte superior de la distribución, como se
aprecia en la figura 3.2
pertenece a una distribución Normal estándar. Si el valor de la estadística de trabajo
es menor que
no se rechaza la hipótesis nula, en caso contrario se rechaza H0 lo cual
implica aceptar H1 . Es decir, si Zp1-p2 <
no se rechaza H0 .
- Si se ha planteado la hipótesis alternativa como:
H1 : 1 < 2 ó H1 : 1 - 2 < k, se tiene una prueba de hipótesis a una cola inferior,
quedando el nivel de significancia ( ) en la parte inferior de la distribución, como se
aprecia en la figura 3.3
Z pertenece a una distribución Normal estándar. Si el valor de la estadística de trabajo
(Zp1-p2) es mayor que Z no se rechaza la hipótesis nula, en caso contrario se rechaza H o
lo cual implica aceptar H1 . Es decir, si Zp1-p2 > Z no se rechaza H0 . Se seleccionó una
muestra aleatoria de 100 hombres y 100 mujeres de un departamento de Colombia; se
halló que de los hombres 60 estaban a favor de una ley de divorcio y de las mujeres 55
estaban a favor de dicha ley. Con base en ésta información, pruebe que la proporción de
hombres que favorece ésta ley es mayor que la proporción de mujeres. Asuma un nivel de
confianza del 99 por ciento.
Solución
H0 : H = M
H1 : H > M
Se utiliza la expresión 3.14
Por la hipótesis alternativa se trabaja a una cola superior. En la tabla de la distribución
normal con una confiabilidad del 99 por ciento, el valor de Z es 2,33. La estadística de
trabajo está en la zona de no rechazo de la hipótesis nula (figura 3.19), es decir, con una
seguridad del 99 por ciento se concluye que no hay diferencia en la proporción de
hombres y mujeres que favorecen la ley de divorcio.