Quarta 29 Março 2017

Fundamentos da análise de variância - ANAVA

Esta experiência virtual tem como objetivo possibilitar ao estudante compreender os fundamentos da inferência na análise de variância e testes discriminatórios subsequentes.

As opções do usuário são escolher:

  • o nível de significância da inferência;
  • o número de repetições de cada grupo;
  • o desvio padrão populacional único que será usado para gerar as amostras;
  • se deseja repetir as amostras: útil quando se varia qualquer das opções acima e se quer repetir as amostras dos grupos para comparação/entendimento do impacto na ANAVA. Contudo, a repetição é impossível quando se varia as médias populacionais;
  • a média populacional de cada grupo.

Cada um desses elementos impacta a análise. Ao alterar qualquer valor os resultados são todos atualizados automaticamente!

Observe que:

  • as estimativas da médias dos grupos não são exatamente iguais aos parâmetros populacionais informados, pois são amostras aleatórias simples (de tamanho igual ao número de repetições) retiradas de cada grupo;
  • quando os valores F calculado (Fcal) e tabelado (Ftab) estão próximos, para um mesmo nível de significância, podem ocorrer divergências entre os resultados dos testes e algoritmo de agrupamento usados na inferência: F, Tukey e Scott & Knott;
  • Scott & Knott (embora tenha excelentes propriedades) não é considerado (consensualmente) um teste inferencial formal (como F e Tukey) mas sim um algoritmo de agrupamento com duas características principais:
    • tem uma metodologia baseada na análise de agrupamento e a definição da distância de corte (dos grupos para formar famílias) é automática e com apelo probabilístico (baseado na distribuição do qui-quadrado);
    • na discriminação não existe sobreposição (um grupo não pode ser classificado em mais de uma família). Isto é bastante útil, particularmente quando se tem grande número de grupos.

O código fonte em R para rodar em um computador pessoal pode ser baixado aqui.