Quarta 13 Dezembro 2017

Variância

Um dos conceitos mais difíceis de se passar ao estudante é o de graus de liberdade (n-1).

Considerando um desvio (d) como d=yi - m, onde yi é a iésima observação amostral e m a estimativa da média (obtida na própira amostra), esta dificuldade se inicia ao explicar o porquê que soma de quadrados dos desvios em relação a estimativa da média, Σd2, é dividida por n-1 e não por n no cálculo da estimativa da variância: s2=Σd2/n-1

Matematicamente não é difícil provar que o valor esperado (esperança matemática) de s2, E(s2), quando Σd2 é dividido por n-1 é igual a σ2, satisfazendo uma das propriedades de um bom estimador: não tendencioso ou não viesado.

Por outro lado, quando dividimos a Σd2 por n, esta medida de dispersão é denominada desvio quadrático médio (dqm=Σd2/n). O valor esperado nesse caso é E(dqm)=(n-1/n)σ2. Ou seja, a dqm em média subestima σ2. Porém, se tomarmos o limite de (n-1/n)σ2 quando n tende ao infinito, veremos que esta estimativa torna-se não viesada.

A simulação abaixo mostra exatamente isso de maneira bem intuitiva, ou seja, quando temos amostras pequenas, dqm tende a subestimar σ2 justificando o uso do n-1. Quando n tende ao inifito é indiferente dividir por n ou por n-1.