6 Delineamento Inteiramente Casualizado





6.1 Teoria


O Delineamento inteiramente casualizado é considerado o delineamento mais simples dentro da estatistica. No DIC as unidades experimentais são destinadas a cada tratamento de uma forma inteiramente casual (sorteio). Os experimentos formulados com este delineamento são denominados “experimentos inteiramente ao acaso.”


O DIC apresenta as seguintes características:

  • Considera apenas os princípios de repetição e casulização;
  • Os tratamentos são divididos em parcelas de forma inteiramente casual;
  • Exige que o material experimental seja semelhante e que as condições de estudo sejam completamentes uniformes;
  • Os aspectos que devem ser considerados na semelhança entre as U.E. são aqueles que interferem nas respostas das mesmas aos tratamentos;
  • Ele geralmente é mais utilizado em experimentos nos quais as condições experimentais podem ser bastante controladas (por exemplo em laboratórios);



6.1.1 Vantagens


  • Delineamento flexível - número de tratamentos e repetições depende apenas da quantidade de parcelas disponíveis

  • O número de repetições pode diferir de um tratamento para o outro (experimento não balanceado)

  • A análise estatística é simples

  • O número de G.L. resíduo é o maior possível



6.1.2 Desvantagens


  • Exige homogeneidade das condições ambientais

  • Pode estimar uma variância residual muito alta


6.1.3 Modelo matemático para DIC


\[\begin{eqnarray} y_{ji}=\mu+\tau_i+\varepsilon_{ij} \end{eqnarray}\]

\(y_{ji}\): é a observação referente ao tratamento i na repetição j;

\(\mu\): é a média geral (ou constante comum a todas as observações);

\(\tau_i\): é o efeito de tratamento, com \(i = 1, 2, . . . , I\);

\(\varepsilon_{ij}\): é o erro experimental, tal que \(\varepsilon_{ij}\)~N(0; \(\sigma^2\)).


6.1.4 Hipóteses e Modelo


\[\begin{eqnarray*} \left\{ \begin{array}{ll} H_0: & \mu_1 = \mu_2 =\mu_i\\[.2cm] H_1: & \mu_i \neq \mu_i' \qquad i \neq i'. \end{array} \right. \end{eqnarray*}\]

CV G.L. S.Q. Q.M. Fcalc Ftab
Tratamentos \(a - 1\) \(SQ_{Trat}\) \(\frac{SQ_{Trat}}{a-1}\) \(\frac{QMTrat}{QMRes}\) \(F(\alpha;GL_{Trat} ;GL_{Res})\)
resíduo \(a(b-1)\) \(SQ_{Res}\) \(SQRes\) -
Total \(ab-1\) \(SQ_{Total}\) - -

Correção

\(C = \frac{(\sum Y_{ij})^2}{ij}\)

Soma de Quadrados Total

\(SQ_{Total}=\sum Y_{ij}^2-C\)

Soma de Quadrados Tratamento

\(SQ_{Tratamento}=\frac{1}{J}\sum Y_{i}^2-C\)

Soma de Quadrados do resíduo

\(SQ_{Resíduo} = SQ_{Total} - SQ_{Tratamento}\)

Quadrado Médio do Tratamento

\(QM_{Tratamento} = \frac{SQ_{Tratamento}}{GL_{Tratamento}}\)

Quadrado Médio do Resíduo

\(QM_{Resíduo} = \frac{SQ_{Resíduo}}{GL_{Resíduo}}\)

F calculado

\(F_{Calculado}=\frac{QM_{Tratamento}}{QM_{Resíduo}}\)



6.2 DIC

Considere o seguinte conjunto de dados:

rm(list=ls())
data(pomegranate)

6.2.0.1 default

Por default, o AgroR realiza a análise de variância, teste de normalidade dos erros de Shapiro-Wilk, teste de homogeneidade das variâncias de Bartlett, teste de independência dos erros de Durbin-Watson, teste de comparação múltipla de Tukey e o gráfico de colunas.

with(pomegranate, DIC(trat, WL))
## 
## -----------------------------------------------------------------
## Normality of errors
## -----------------------------------------------------------------
##                          Method Statistic   p.value
##  Shapiro-Wilk normality test(W) 0.9448293 0.2087967
## As the calculated p-value is greater than the 5% significance level, hypothesis H0 is not rejected. Therefore, errors can be considered normal
## 
## -----------------------------------------------------------------
## Homogeneity of Variances
## -----------------------------------------------------------------
##                               Method Statistic   p.value
##  Bartlett test(Bartlett's K-squared)  8.568274 0.1275737
## As the calculated p-value is greater than the 5% significance level,hypothesis H0 is not rejected. Therefore, the variances can be considered homogeneous
## 
## -----------------------------------------------------------------
## Independence from errors
## -----------------------------------------------------------------
##                  Method Statistic   p.value
##  Durbin-Watson test(DW)  2.104821 0.1924474
## As the calculated p-value is greater than the 5% significance level, hypothesis H0 is not rejected. Therefore, errors can be considered independent
## 
## -----------------------------------------------------------------
## Additional Information
## -----------------------------------------------------------------
## 
## CV (%) =  10.84
## R-squared =  0.92
## Mean =  2.2596
## Median =  2.225
## Possible outliers =  No discrepant point
## 
## -----------------------------------------------------------------
## Analysis of Variance
## -----------------------------------------------------------------
##           Df   Sum Sq    Mean.Sq  F value        Pr(F)
## trat       5 3.692121 0.73842417 12.31191 2.723541e-05
## Residuals 18 1.079575 0.05997639
## As the calculated p-value, it is less than the 5% significance level.The hypothesis H0 of equality of means is rejected. Therefore, at least two treatments differ
## 
## 
## -----------------------------------------------------------------
## Multiple Comparison Test
## -----------------------------------------------------------------
##      resp groups
## T5 2.6375      a
## T4 2.6200      a
## T3 2.6175      a
## T6 2.1625     ab
## T1 1.8425      b
## T2 1.6775      b
## 

6.2.0.2 Alterando teste de médias

Para alterar o teste de médias, é necessário alterar o argumento mcomp.

with(pomegranate, DIC(trat, WL)) # tukey
with(pomegranate, DIC(trat, WL, mcomp = "sk")) # Scott-Knott
with(pomegranate, DIC(trat, WL, mcomp = "duncan")) # Duncan
with(pomegranate, DIC(trat, WL, mcomp = "lsd")) # LSD

6.3 Transformando dados


  • O modelo de Análise de Variância pressupõe que exista homocedasticidade, ou seja, que os tratamentos apresentem a mesma variabilidade;
  • Algumas vezes este pressuposto pode não ser atendido e assim, para corrigir este problema existe uma saída por vezes bastante simples que é a transformação de dados;
  • Esta técnica consiste na utilização de um artifício matemático para tornar o modelo de ANOVA válido.
6.3.0.0.1 Heterogeneidade Irregular
  • Ocorre quando alguns tratamentos apresentam maior variabilidade do que outros, contudo, não existe uma associação entre média e variância;

  • Neste caso, não há uma transformação matemática que elimine esta variabilidade.

Solução:

  • Modelos Lineares Generalizados;

  • Análise não paramétrica.


6.3.0.0.2 Heterogeneidade Regular
  • Acontece quando existe alguma associação entre as médias dos tratamentos e a variância;
  • A heterocedasticidade regular está associada é falta de normalidade do erros;

Solução:

  • Transformação dos dados;

  • Modelos Lineares Generalizados;

  • Análise não paramétrica.



6.3.0.0.3 Princípio de transformação


Seja \(E(Y) = \mu\) a média de Y e suponha que o desvio padrão de Y é proporcional a potência da média de Y tal que:

\(\sigma Y \alpha \mu^\alpha.\)

O objetivo é encontrar uma transformação de \(Y\) que gere uma variância constante.

Suponha que a transformação é uma potência dos dados originais, isto é:

\(Y^*=Y^\lambda\)

Assim, pode ser mostrado que:

\(\sigma Y^* \alpha \mu^{\lambda+ \alpha-1}.\)

Caso \(\lambda = 1-\alpha\), então a variância dos dados transformados \(Y^*\) é constante, mostrando que não é necessário transformação.

Algumas das transformações mais comuns são:


\(\lambda\) Transformação
1 Nenhuma
0,5 \(\sqrt{y}\)
0 log(y)
-0,5 \(\frac{1}{\sqrt{y}}\)
-1 \(\frac{1}{y}\)

Box & Cox (1964) mostraram como o parâmetro de transformação \(\lambda\) em \(Y^* = Y^\lambda\) pode ser estimado simultaneamente com outros parâmetros do modelo (média geral e efeitos de tratamentos) usando o método de máxima verossimilhança. O procedimento consiste em realizar, para vários valores de \(\lambda\), uma análise de variância padrão sobre:

\[Y_i(\lambda) = \left\{ \begin{array}{ll} \ln(X_i),~~~~~~\textrm{se $\lambda = 0$,} \\ \\ \dfrac{X_i^{\lambda} - 1}{\lambda},~~~~\textrm{se $\lambda \neq 0$,}\end{array} \right.\]

A estimativa de máxima verossimilhança de \(\lambda\) é o valor para o qual a soma de quadrado do resíduo, SQRes(\(\lambda\)), é mínima.

Este valor de \(\lambda\) é encontrado através do gráfico de SQRes(\(\lambda\)) versus \(\lambda\), sendo que \(\lambda\) é o valor que minimiza a SQRes(\(\lambda\)).

Ou, ainda, o valor de \(\lambda\) que maximiza a função de logverossimilhança.


Um intervalo de confiança \(100(1-\alpha)\)% para \(\lambda\) pode ser encontrado calculando-se:

\(IC(\lambda) = SQRes(\lambda)(1 \pm \frac{t2^2/2=2;v }{v})\)

em que \(v\) é o número de graus de liberdade.

Se o intervalo de confiança incluir o valor \(\lambda = 1\), isto quer dizer que não é necessário transformar os dados.

No pacote AgroR, o argumento transf define a transformação solicitada, conforme a seguir:

with(pomegranate, DIC(trat, WL, transf = 0))
## 
## -----------------------------------------------------------------
## Normality of errors
## -----------------------------------------------------------------
##                          Method Statistic   p.value
##  Shapiro-Wilk normality test(W) 0.9694183 0.6526381
## As the calculated p-value is greater than the 5% significance level, hypothesis H0 is not rejected. Therefore, errors can be considered normal
## 
## -----------------------------------------------------------------
## Homogeneity of Variances
## -----------------------------------------------------------------
##                               Method Statistic   p.value
##  Bartlett test(Bartlett's K-squared)  5.657984 0.3409331
## As the calculated p-value is greater than the 5% significance level,hypothesis H0 is not rejected. Therefore, the variances can be considered homogeneous
## 
## -----------------------------------------------------------------
## Independence from errors
## -----------------------------------------------------------------
##                  Method Statistic   p.value
##  Durbin-Watson test(DW)  2.001907 0.1261966
## As the calculated p-value is greater than the 5% significance level, hypothesis H0 is not rejected. Therefore, errors can be considered independent
## 
## -----------------------------------------------------------------
## Additional Information
## -----------------------------------------------------------------
## 
## CV (%) =  12.59
## R-squared =  0.94
## Mean =  2.2596
## Median =  2.225
## Possible outliers =  No discrepant point
## 
## -----------------------------------------------------------------
## Analysis of Variance
## -----------------------------------------------------------------
##           Df    Sum Sq    Mean.Sq  F value        Pr(F)
## trat       5 0.7834427 0.15668854 15.61523 5.318727e-06
## Residuals 18 0.1806181 0.01003434
## As the calculated p-value, it is less than the 5% significance level.The hypothesis H0 of equality of means is rejected. Therefore, at least two treatments differ
## 
## 
## -----------------------------------------------------------------
## Multiple Comparison Test
## -----------------------------------------------------------------
##         resp groups  respO
## T5 0.9687134      a 2.6375
## T3 0.9570245      a 2.6175
## T4 0.9537130      a 2.6200
## T6 0.7705460     ab 2.1625
## T1 0.6068284     bc 1.8425
## T2 0.5152916      c 1.6775
## 
## NOTE: resp = transformed means; respO = averages without transforming

6.4 Kruskal-Wallis

with(pomegranate, DIC(trat, WL, test = "noparametric", geom="point"))
## 
## 
## -----------------------------------------------------------------
## Statistics
## -----------------------------------------------------------------
##      Chisq     p.chisq
##   18.75631 0.002133687
## 
## 
## -----------------------------------------------------------------
## Parameters
## -----------------------------------------------------------------
##             test p.ajusted name.t ntr alpha
##   Kruskal-Wallis      holm   trat   6  0.05
## 
## 
## -----------------------------------------------------------------
## Multiple Comparison Test
## -----------------------------------------------------------------
##      Mean         SD  Rank Groups
## T1 1.8425 0.19939492  5.75      c
## T2 1.6775 0.12284814  3.50      c
## T3 2.6175 0.30619983 18.25     ab
## T4 2.6200 0.42669271 17.25     ab
## T5 2.6375 0.14244882 19.50      a
## T6 2.1625 0.09429563 10.75     bc

6.4.0.1 Alterando parâmetros gráficos

with(pomegranate, DIC(trat, WL, geom="point")) # tipo de gráfico
with(pomegranate, DIC(trat, WL, 
                      ylab = "Weight loss (%)", 
                      xlab="Treatments")) # nome de eixos

6.5 Fator Quantitativo

rm(list=ls())
data("phao")
with(phao, DIC(dose,comp,quali=FALSE,grau=2))
## 
## -----------------------------------------------------------------
## Normality of errors
## -----------------------------------------------------------------
##                          Method Statistic   p.value
##  Shapiro-Wilk normality test(W) 0.9647717 0.5174008
## As the calculated p-value is greater than the 5% significance level, hypothesis H0 is not rejected. Therefore, errors can be considered normal
## 
## -----------------------------------------------------------------
## Homogeneity of Variances
## -----------------------------------------------------------------
##                               Method Statistic   p.value
##  Bartlett test(Bartlett's K-squared)  4.428915 0.3510598
## As the calculated p-value is greater than the 5% significance level,hypothesis H0 is not rejected. Therefore, the variances can be considered homogeneous
## 
## -----------------------------------------------------------------
## Independence from errors
## -----------------------------------------------------------------
##                  Method Statistic    p.value
##  Durbin-Watson test(DW)  1.801827 0.08064338
## As the calculated p-value is greater than the 5% significance level, hypothesis H0 is not rejected. Therefore, errors can be considered independent
## 
## -----------------------------------------------------------------
## Additional Information
## -----------------------------------------------------------------
## 
## CV (%) =  11.71
## R-squared =  0.93
## Mean =  14.436
## Median =  15.3
## Possible outliers =  No discrepant point
## 
## -----------------------------------------------------------------
## Analysis of Variance
## -----------------------------------------------------------------
##           Df   Sum Sq Mean.Sq  F value        Pr(F)
## trat       4 145.8096 36.4524 12.76166 2.557884e-05
## Residuals 20  57.1280  2.8564
## As the calculated p-value, it is less than the 5% significance level.The hypothesis H0 of equality of means is rejected. Therefore, at least two treatments differ

## 
## 
## -----------------------------------------------------------------
## Regression
## -----------------------------------------------------------------

##               Estimate Std. Error   t value     Pr(>|t|)
## (Intercept) 10.2097143 0.68981140 14.800733 6.427099e-13
## trat         2.8822857 0.40856781  7.054608 4.456995e-07
## I(trat^2)   -0.3042857 0.04897332 -6.213296 2.971498e-06
## 
## ----------------------------------------------------
## Deviations from regression
## ----------------------------------------------------
##  GL       SQ         F   p-value
##   2 1.968229 0.3445296 0.7126767