Free Essay

Tp Probit Y Logit Stata

In: Science

Submitted By guidito
Words 1823
Pages 8
Respuestas:
Ejercicio 1: a)Sin lugar a dudas, los resultados coinciden con los de Mroz. Por el otro lado, encontramos un valor sospechoso en la variable WHRS. En particular, el máximo es de 4950 horas trabajadas en el año 1975. Es decir, esta cantidad de horas no es común (si suponemos que trabajasen un promedio de 10 horas por día harían falta 495 días).

b) WALas mujeres que trabajaron eran más jóvenes pero, como hay solo 1 año de diferencia fue considerado irrelevante.
WE En promedio, las mujeres que trabajan poseen 1 año más de educación pero nuevamente no es relevante ya que ese año no hace la diferencia.
K618 En este caso, los valores coinciden
HA El valor de la media difiere muy poco
HE En este caso es lo mismo
HHRS En este caso, las horas trabajadas por el esposo son mayores cuando la mujer notrabaja, entendible al ser el único individuo que se encarga de mantener el hogar.
KL6 En cuanto a esta variable, es entendible que sea mayor cuando la mujer no seencuentra trabajando ya que le dedica más tiempo a la crianza de sus hijos.
HW Con respecto al salario del esposo, este es mayor cuando la esposa no trabaja.
Respecto al salario de reserva de las mujeres, este es mayor cuando tiene hijos pequeños (en estecaso<6 años). Es decir, para que la mujer trabaje, el salario del trabajo > salario de reserva que ellatiene y este último depende de la cantidad de hijos pequeños y del marido
AX Esta variable muestra una gran diferencia entre la mujer que se encuentra trabajando yla que no trabaja. Sin lugar a dudas, esto hace referencia a las decisiones personales de las mujeresen cuanto a preponderar el cuidado de la casa y su familia por encima de su carrera laboral.Sumándole a esto que el esposo recibe un mayor salario.Con respecto a la variable FAMINC, el ingreso del hogar familiar cae cuando la mujer notrabaja. d) La ecuación tiene sentido, ya que se trata de estimar el salario típico de una mujer. Por esta razón, es correcto incluir como variables explicativas la edad de la mujer, su experiencia laboral previa, su educación y su lugar de residencia.
Con respecto a la comparación de medias entre las variables LWW y FLWW, esta diferencia no es sustancial ya que se puede considerar entendible por las ventajas comparativas que poseen las mujeres trabajadores sobre las otras (años de trabajo previo, educación alcanzada, su edad, etc).
Los estimadores resultantes de esta regresión son inconsistentes ya que esta se encuentra truncada. Es decir, se asume que las horas trabajadas por las mujeres (WHRS>0) se aplican a toda la población en lugar de una muestra determinada.

Ejercicio 2: a) Se verifica que cuando la variable WHRS vale 0, la variable LFP también vale 0.
En este caso, el signo de los parámetros coincide con la intuición ya que:
KL6 y K618 Ambos tienen signo negativo. Es decir, las mujeres optan por trabajar menos cuando tienen hijos. Existe una relación inversa.
WA Este signo también es negativo. Por esta razón, a medida que la mujer se vuelve mayor, esta trabaja menos. Existe una relación inversa.
WE Este signo es positivo. Cuanto más educada es la mujer, mayor cantidad de horas trabaja. Existe una relación directa.
LWW1 Este signo es positivo. Cuanto más gana la mujer, mas trabaja. Existe una relación directa.
PRIN Este signo es negativo lo que implica que hay una relación inversa entre la variable PRIN y WHRS.

Por el otro lado, si bien los signos de los parámetros tienen sentido, el R2es 0.1225. Este valor tan pequeño se puede explicar por un truncamiento en el modelo ya que se considera solamente a la población de mujeres que trabaja.
b)

c) Los problemas que presenta el Procedimiento I son que estima de manera inconsistente los parámetros del modelo ya que asume que la ecuación de horas trabajadas por las mujeres se aplica para todas las personas, en vez de a aquellas que trabajan una cantidad positiva de horas (WHRS>0, en este caso). Por esta razón, el modelo se encuentra truncado, lo que implica que las estimaciones no solo son inconsistentes sino también sesgadas.
Ejercicio 3: a) En general, el signo de los parámetros tiene sentido, por lo explicado anteriormente (punto 2a), excepto el coeficiente de la variable CIT. Este valor es negativo lo que implica que hay una relación inversa entre la variable y la probabilidad de participar en la fuerza de trabajo. Esto no tiene sentido, ya que al vivir en una ciudad, aumentan las oportunidades de trabajo.

Por otra parte, 7 observaciones presentan un valor negativo (<0) mientras que 9 observaciones presentan un valor superior a 1(>1).
Cuando se utiliza MCC para estimar un modelo de Probabilidad Lineal – en este caso LFP es la variable dependiente dummy - , la probabilidad estimada puede caer fuera del rango [0,1]. En estos casos, la varianza será negativa, lo cual no tiene sentido. Asimismo, las estimaciones de los parámetros no son buenas.
El valor del R2 es 0.1567. Lo que implica que la variabilidad de la variable dependiente está explicada solamente en un 15% por las variables explicativas, esto a su vez significa que el modelo no es bueno.
b) En este caso, los signos de los parámetros tienen sentido ya que son iguales a los explicados anteriormente, excepto el coeficiente de la variable CIT se vuelve positivo, lo cual tiene que ver con que hay una relación directa entre vivir en una ciudad y la probabilidad de participar en la fuerza de trabajo.
Los parámetros distintos de 0 son: LWW1, KL6, WA, WE y PRIN.
Según el Stata 11, converge en 4 iteraciones.
Con respecto al valor del pseudo-R2 es 0.1270. Sin lugar a dudas, esto indica que un bajo porcentaje de las predicciones son correctas
Por otra parte, en esta muestra, la aproximación de Amemiya no es buena. Algunos ejemplos son: LOGIT | | | OLS | | | AMEMIYA | LWW1 | 0,4644233 | | LWW1 | 0,093275 | | 0,116106 | KL6 | -1 | | KL6 | -0,29064 | | -0,3673 |

Si bien los valores son cercanos, no equivale a 0,25 veces sino que en promedio equivale a un 0,19 veces aproximadamente.
Con respecto a los coeficientes de la variable dummy (CIT), la aproximación no es buena mientras que para el coeficiente que acompaña a la constante si lo es: LOGIT | | | OLS | | AMEMIYA+0,5 | CIT | 0,0127482 | | CIT | -0,00448 | 0,50318705 | CONS | 0,9510144 | | CONS | 0,692292 | 0,7377536 |

c) Con respecto a los signos de los parámetros, estos tienen sentido ya que coinciden con los signos de la estimación utilizando el modelo Logit. Es decir, todos los parámetros tienen los signos iguales.
Los parámetros distintos de 0 son: LWW1, KL6, WA, WE y PRIN
Según el Stata 11, converge en 4 iteraciones. En particular, converge a la misma velocidad que en el modelo Logit. Con respecto al valor del pseudo-R2 es 0.1272. Nuevamente, esto indica que el porcentaje de las predicciones correctas es bajo. d) En este caso, los log-likelihoods son similares. En particular, el de Logit es -449.47564, mientras que el de Probit es -449.39696. A su vez, tanto los signos de los parámetros como la significatividad de los mismos coinciden. Es decir, los parámetros distintos de 0 en ambos casos son: LWW1, KL6, WA, WE y PRIN.
Por otra parte, utilizando como dato que P=0,568 y que f(P)=0,393 queda: P*(1-P)*βLogit | | f(P)*βProbit | | 0,245376 | 0,113958 | | 0,393 | 0,110843 | | -0,36051 | | | -0,34616 | | -0,01257 | | | -0,01168 | | -0,01429 | | | -0,01374 | | 0,052013 | | | 0,050191 | | -0,00456 | | | -0,00434 | | 0,003128 | | | 0,003934 | | -8,7E-06 | | | -8,3E-06 | | 0,233356 | | | 0,223184 |

Como se puede observar, evaluado en ese valor de P estimado, los efectos son similares para los modelos Logit y Probit, pero en general los efectos del modelo Probit son menores en valor absoluto que los efectos del modelo Logit.
En cambio, utilizando como dato que P=0,9 y f(P)=0,175 queda: P*(1-P)*βLogit | | f(P)*βProbit | | 0,09 | 0,041798 | | 0,175 | 0,049357 | | -0,13223 | | | -0,15414 | | -0,00461 | | | -0,0052 | | -0,00524 | | | -0,00612 | | 0,019078 | | | 0,02235 | | -0,00167 | | | -0,00193 | | 0,001147 | | | 0,001752 | | -3,2E-06 | | | -3,7E-06 | | 0,085591 | | | 0,099382 |

En este caso, sucede lo contrario, evaluando en la cola de la distribución, si bien los efectos son parecidos, en valor absoluto los del modelo Probit son mayores a los del modelo Logit. e) La mejor aproximación es la provista por Amemiya. Es decir, aquella que sostiene que β Probit=0,625* β Logit.

f) El problema que presenta realizar la estimación por MCC es que los estimadores que produce son inconsistentes y sesgados ya que existe un problema de endogeneidad. En particular, estos coeficientes que acompañan a las variables explicativas se encuentran sesgados hacía abajo.
Ejercicio 6: a) Para la primera regresión, los parámetros distintos de 0 son aquellos que acompañan a las variables explicativas KL6 y PRIN, mientras que para la segunda regresión son KL6, PRIN, AX y AX2. La variable LWW1 se encuentra excluida debido a que genera problemas de endogeneidad. Por otra parte, podría estar incluida en la variable PRIN.

b) En cuanto a los signos de la primera regresión, los de las variables KL6, K618, WE, WA2, WAWE2, WMED, WFED y UN son negativos. Por esta razón, presentan una relación inversa con la variable dependiente. Por el otro lado, el resto de las variables: WA,WE2, WAWE WA3, WE3, WA2WE, CIT, PRIN y la constante poseen signo positivo por lo que existe una relación directa con la variable dependiente. El único parámetro distinto de 0 es aquel que acompaña a la variable WAWE2 mientras que el resto no es estadísticamente significativo.
Asimismo, realizando la misma regresión pero esta vez añadiendo las variables AX y AX2, los resultados no cambian. En particular, los signos son iguales para cada variable mientras que ahora los únicos parámetros distintos de 0 son los de las variables WAWE2 y AX.

En cuanto a las estimaciones de determinación del salario, "sample selectivty" no es estadísticamente significante

c) Los resultados obtenidos de la primera regresión coinciden con aquellos obtenidos por Mroz en la ecuación (11.51).
Por otro lado, los resultados de la segunda regresión coinciden con los reportados por Mroz en la ecuación (11.53). En particular, el coeficiente que acompaña a la variable INVR1 no es estadísticamente significativo lo que implica que no se puede rechazar la hipótesis nula de que no existe sesgo de selección.
En cuanto a los resultados de la tercera regresión, estos coinciden con los de Mroz de la ecuación (11.50).
Por último, los resultados de la cuarta regresión coinciden con los de la ecuación (11.52) de Mroz.

Similar Documents