En este problema se analiza la eficacia de tres insecticidas (A, B y C) con el mismo precio. Para ello, se cuenta con información de 862 insectos, a los cuales se les asignó aleatoriamente un tipo de insecticida. Se registró la cantidad de insectos expuestos a cada tipo de insecticida, la dosis aplicada y el número de insectos que murieron. Nuestros principales objetivos son identificar si algún insecticida es mejor para eliminar el 70% de los insectos y ver si algunos de los insecticidas tienen comportamientos similares

Para comprender mejor la distribución de los datos, presentamos una gráfica de dispersión que muestra la proporción de insectos muertos según el insecticida aplicado.

En la gráfica, observamos que los puntos azules correspondientes al insecticida C están por encima de los de los otros dos insecticidas. Esto sugiere que, probablemente, para matar una cantidad similar de insectos, se requiera una dosis menor del insecticida C. También se puede notar que los insecticidas A y B tienen un comportamiento similar en la proporción de insectos muertos respecto a la dosis aplicada.

Ahora vamos a intentar ajustar un modelo a este problema, considerando que y es si el insecto muere o no es decir una variable binaria, usando 3 ligas: logit, probit y cloglog y usando como covariables el tipo de insecticida y ln(Deposit)

Considerando a insecticida A como nuestro nivel de referencia nos queda lo siguiente:

\[g(\mu_i)=\beta_0+\beta_1 I_B+\beta_2 I_C+\beta_3 lnD+\beta_4 I_BlnD + \beta_5 I_ClnD\]

Por lo que con cada liga obtenemos los siguiente resultados:
Tipo Info.Adicional1 Info.Adicional2 AIC
GLM Familia:Binomial Liga: logit 100.89
GLM Familia:Binomial Liga: probit 100.61
GLM Familia:Binomial Liga: cloglog 113.85

Vemos qe el modelo con liga probit es el que tiene mejor AIC, sin embargo al analizar supuestos ninguno de los 3 modelos se adapta bien al modelo por lo que ahora probaremos agregando la interacción de insenticida con la covariable \(lnD^2\), generando ahora los siguientes resultados:

Tipo Info.Adicional1 Info.Adicional2 AIC
GLM Familia:Binomial Liga: logit 94.590
GLM Familia:Binomial Liga: probit 94.575
GLM Familia:Binomial Liga: cloglog 94.300

Notamos una mejora en los AIC de los 3 modelos y aunque son muy parecidos nos quedamos con el tercer modelo que es el que tiene el AIC más bajo.Esto por que el hecho de elevar al cuadrado a lnD hace que podamos meter una relación no lineal y así permitimos que el efecto de la dosis cambie de manera más compleja.

Ahora para ver si nos quedamos definitivamente con este modelo análizamos los supuestos

Con esto observamos que en la gráfica QQ plot de los residuos, los triángulos se ajustan bastante bien a la línea diagonal. Además, en las pruebas estadísticas, los p-values son mayores a los niveles de significancia, lo que refuerza esta conclusión. Por otro lado, en la segunda gráfica vemos que las líneas negras no muestran tendencias fuertes, por lo que podemos concluir que el modelo se ajusta adecuadamente.

Así que nuesto modelo con liga cloglog quedaría como:

\[g(\mu_i)=\beta_0+\beta_1 I_B+\beta_2 I_C+\beta_3 lnD+\beta_4 lnD^2 + \beta_5 I_B lnD + \beta_6 I_C lnD + \beta_7 I_B lnD^2 + \beta_8 I_C lnD^2\] Sustituyendo los valores dados por el modelo;

\[g(\mu_i)=-9.0717+2.3126 I_B+6.9121 I_C+9.6286 lnD -2.4908 lnD^2 -2.7378 I_B lnD -6.3201 I_C lnD + 0.8442 I_B lnD^2 + 1.6879 I_C lnD^2\]

Para ver como se ajusta el modelo tenemos la siguiente gráfica:

Con lo cual confirmamos que el modelo se ajusta adecuadamente a los datos observados, en los tres tipos de insecticidas.

Para cada insecnticida el modelo se ve como: \[\eta(I_A)=\beta_0 + \beta_3 lnD + \beta_4lnD^2\] \[\eta(I_B)=\beta_0 + \beta_1 + (\beta_3+\beta_5)lnD+(\beta_4+\beta_7)lnD^2\] \[\eta(I_C)=\beta_0 + \beta_2 + (\beta_3+\beta_6)lnD+(\beta_4+\beta_8)lnD^2\]

Ya que tenemos un modelo que se ajusta bien calculamos la dosis mínima para cada insecticida con la que el 70% de los insectos muere, para esto resulvemos 3 sistemas de ecuaciones cuadraticas usando:

\[ ln(Dmin_{Ií})= \frac{ -b - \sqrt{b^2 - 4ac} }{2a} \] Para el insecticida A consideramos:

\(a=\beta_4 =-2.4908\), \(b= \beta_3 =9.6286\) y \(c= \beta_0-ln(-ln(1-0.7))=-9.2573\) obteniendo una dosis mínima de 6.0140

Para el insecticida B consideramos:

\(a=\beta_4 + \beta_7=-1.6466\), \(b= \beta_3+ \beta53=6.889\) y \(c= \beta_0+\beta_1-ln(-ln(1-0.7))=-6.9447\) obteniendo una dosis mínima de 5.4406

Para el insecticida C consideramos:

\(a=\beta_4 + \beta_8=-0.8029\), \(b= \beta_3+ \beta_6=3.3085\) y \(c= \beta_0+\beta_2-ln(-ln(1-0.7))=-2.3452\) obteniendo una dosis mínima de 2.4833

Con esto en mente, ¿podemos afirmar que algún insecticida es mejor? Para responder a esta pregunta, consideramos que la dosis mínima es de 2.4833. Dado que el insecticida C presenta esta dosis mínima, evaluaremos si este es, en efecto, el mejor insecticida bajo dicha condición.

Para esto queremos ver que:

Para que el Insecticida C sea mejor al A \[\beta_0 + \beta_2 + (\beta_3+\beta_6)(0.9096)+ (\beta_4+\beta_8)(0.9096^2)>\beta_0+\beta_3(0.9096)+\beta_4(0.9096)^2\] \[\beta_2+0.9096\beta_6+(0.9096^2)\beta_8>0\] Para que el Insecticida C sea mejor al B \[\beta_0 + \beta_2 + (\beta_3+\beta_6)(0.9096)+ (\beta_4+\beta_8)(0.9096^2)> \beta_0 + \beta_1 + (\beta_3+\beta_5)(0.9096)+(\beta_4+\beta_7)(0.9096^2)\] \[-\beta_1+\beta_2-0.9096\beta_5+0.9096\beta_6-0.9096\beta_7+0.9096^2\beta_8>0\] Por lo que nuestra prueba de hipótesis simultanea queda como

H0:\(\beta_2+0.9096\beta_6+(0.9096^2)\beta_8\leq0\), \(-\beta_1+\beta_2-0.9096\beta_5+0.9096\beta_6-0.9096\beta_7+0.9096^2\beta_8\leq0\) vs

Ha:\(\beta_2+0.9096\beta_6+(0.9096^2)\beta_8>0\), \(-\beta_1+\beta_2-0.9096\beta_5+0.9096\beta_6-0.9096\beta_7+0.9096^2\beta_8>0\)

Donde obetenmos lo siguiente:

## 
##   Simultaneous Tests for General Linear Hypotheses
## 
## Fit: glm(formula = cbind(Killed, Number - Killed) ~ Insecticide * 
##     lnD + lnD2 * Insecticide, family = binomial(link = "cloglog"), 
##     data = df)
## 
## Linear Hypotheses:
##        Estimate Std. Error z value Pr(>z)    
## 1 <= 0   2.5598     0.3450   7.421 <1e-10 ***
## 2 <= 0   2.0431     0.2685   7.610 <1e-10 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## (Adjusted p values reported -- single-step method)

Como ambos p-values son menores que el nivel de significancia del modelo, podemos concluir que, tomando en cuenta la dosis mínima, el insecticida C es mejor que los otros dos. Es decir, se requiere una menor dosis del insecticida C para eliminar el 70% una cierta cantidad de insectos en comparación con los otros dos insecticidas

Por último vamos a ver los insecticidas A y B tienen un desempeño similar y para esto se necesita que:

\[\eta(I_A)=\beta_0 + \beta_3 lnD + \beta_4lnD^2 = \beta_0 + \beta_1 + (\beta_3+\beta_5)lnD+(\beta_4+\beta_7)lnD^2 =\eta(I_B)\]

Para esto planteamos las hipótesis:

H0:\(\beta_1=0, \beta_5=0, \beta_7=0\) vs Ha:\(\beta_1\neq0, \beta_5\neq0, \beta_7\neq0\)

## 
##   General Linear Hypotheses
## 
## Linear Hypotheses:
##        Estimate
## 1 == 0   2.3126
## 2 == 0  -2.7378
## 3 == 0   0.8442
## 
## Global Test:
##   Chisq DF Pr(>Chisq)
## 1 3.188  3     0.3636

Por lo que no se rechaza H0 y entonces es plausible pensar que los insecticidas A y B se comportan iguales.