Esta experiência virtual tem como objetivo possibilitar ao estudante compreender os fundamentos da inferência na análise de variância e testes discriminatórios subsequentes.
As opções do usuário são escolher:
- o nível de significância da inferência;
- o número de repetições de cada grupo;
- o desvio padrão populacional único que será usado para gerar as amostras;
- se deseja repetir as amostras: útil quando se varia qualquer das opções acima e se quer repetir as amostras dos grupos para comparação/entendimento do impacto na ANAVA. Contudo, a repetição é impossível quando se varia as médias populacionais;
- a média populacional de cada grupo.
Cada um desses elementos impacta a análise. Ao alterar qualquer valor os resultados são todos atualizados automaticamente!
Observe que:
- as estimativas da médias dos grupos não são exatamente iguais aos parâmetros populacionais informados, pois são amostras aleatórias simples (de tamanho igual ao número de repetições) retiradas de cada grupo;
- quando os valores F calculado (Fcal) e tabelado (Ftab) estão próximos, para um mesmo nível de significância, podem ocorrer divergências entre os resultados dos testes e algoritmo de agrupamento usados na inferência: F, Tukey e Scott & Knott;
- Scott & Knott (embora tenha excelentes propriedades) não é considerado (consensualmente) um teste inferencial formal (como F e Tukey) mas sim um algoritmo de agrupamento com duas características principais:
- tem uma metodologia baseada na análise de agrupamento e a definição da distância de corte (dos grupos para formar famílias) é automática e com apelo probabilístico (baseado na distribuição do qui-quadrado);
- na discriminação não existe sobreposição (um grupo não pode ser classificado em mais de uma família). Isto é bastante útil, particularmente quando se tem grande número de grupos.
O código fonte em R para rodar em um computador pessoal pode ser baixado aqui.