Os métodos estatísticos usam dados de amostra para fazer previsões e descrições sobre os valores ou parâmetros da população. Os métodos de inferência envolvem a comparação das estatísticas de amostra observadas com os valores esperados. Por exemplo, suponha que uma organização de pesquisa questione 2000 eleitores para estimar a proporção de todos que votarão em uma eleição. Esperamos que a proporção dos 2000 eleitores na pesquisa forneça alguma informação sobre todos os eleitores. Existe um grau de aleatoriedade associado ao resultado da pesquisa; se o resultado for muito próximo do resultado da eleição, temos confiança no resultado da pesquisa. A probabilidade de a proporção da inquirição ser próxima da proporção da população determina a confiança no resultado, o que nos motiva a calcular o grau de confiabilidade da pesquisa.
Um intervalo de confiança (IC) é uma estimativa que mostra o intervalo no qual o parâmetro se encontra com determinado nível de probabilidade. Como o os dados da amostra são variáveis aleatórias, o intervalo de confiança não apresenta o valor real do parâmetro em todos os casos. Contudo, é possível saber a probabilidade com que o parâmetro é observado dentro desse intervalo. Quando se considera uma probabilidade de 95% podemos afirmar que, em 95% dos experimentos, o intervalo calculado incluirá o valor verdadeiro do parâmetro.
Para melhor esclarecer, vejamos um exemplo: imagine que seja coletado a altura de 40 alunos de escola, onde a média de altura é de 1,75m, e o desvio padrão das alturas é 20cm. Com essas informações, já somos capazes de dizer que, considerando 95% de confiança, o intervalo para média da altura dos alunos dessa escola se situa entre 1,75m ± 6,2cm. Vejamos passo a passo como se construir essa ferramenta que é muito utilizada em nosso dia a dia:
1º Passo: Encontre o número de amostras n, calcule a média X e o desvio padrão s dessas amostras. Em nosso exemplo acima, esses números foram 40, 1,75m, 0,20m, respectivamente.
2º Passo: Decida qual intervalo de confiança deseja. Por exemplo, 90%, 95% e 99% são escolhas comuns. Em seguida, encontre o valor “Z” para esse intervalo de confiança. É um valor padronizado facilmente encontrado. Veja abaixo alguns exemplos.
Tabela - Intervalo de confiança.
Intervalo de Confiança | Z |
80% | 1,28 |
85% | 1,44 |
90% | 1,64 |
95% | 1,96 |
99% | 2,57 |
99,5% | 2,80 |
99,9% | 3,29 |
Fonte: Elaborada pelo autor.
3º Passo: Use esse Z na fórmula para o intervalo de confiança:
Em que é a média amostral, Z é o valor Z associado a probabilidade desejada e é o desvio padrão amostral da média. Como desejamos criar um intervalo para média, devemos usar seu desvio padrão.
Aplicando na fórmula acima os dados utilizados em nosso exemplo:
Assim, o intervalo de confiança de 95% para a média populacional é [1,688; 1,812].
Importante: este intervalo não deve ser interpretado como “com 95% de probabilidade, a média populacional está entre 1,688 e 1,812”. Como a média populacional é uma constante, a probabilidade de estar neste intervalo é 0 ou 1. Podemos afirmar que, se este experimento for realizado muitas vezes (coletando novas amostras de alunos da escola), a média populacional estará inclusa em 95% dos intervalos calculados.
A fórmula do intervalo de confiança também pode ser escrita da seguinte forma:
Em que μ é a média populacional (desconhecida), é o valor Z associado ao intervalo de confiança escolhido e α é o nível de significância, que é 1 - IC. ou seja, IC = 1 - α. Podemos dizer que, se repetirmos o experimento muitas vezes, em 100(1-α)% dos casos a média populacional estará contida nos intervalos calculado. Se IC = 95%, α será 0,05 e α/2 = 0,025. como o teste é bicaudal, temos um α de 0,025 para o lado direito e 0,025 para o lado esquerdo da distribuição.
Se o desvio padrão populacional σ for desconhecido, deve-se usar o desvio padrão da amostra, s.
Questão: Um economista observa o comportamento de um ativo financeiro ao longo de um período de 30 dias e encontra um retorno médio de 5% com desvio padrão de 4%. Construa um intervalo de confiança para a média dos retornos desse ativo considerando os seguintes níveis de confiança: 1%, 5% e 10%.
Para encontrar o por meio da tabela Z, considerando que a distribuição é bicaudal, devemos encontrar os valores críticos da seguinte forma:
Para 1% de significância, o intervalo de confiança é 1 - α = 0,99 = 0,495 + 0,495 (por simetria). Logo, é preciso encontrar esse número na tabela para obter os valores críticos correspondente a ele.
Figura - Tabela Z.
Fonte: Elaborada pelo autor.
Assim, o valor crítico para P(0 ≤ z ≤ 0,495) é 2,5 + 0,08 = 2,58. O será, então, 2,58 para ambos os lados. O mesmo cálculo pode ser aplicado para os outros níveis de significância.
Para um nível de confiança de 95%, o valor crítico é P(0 ≤ z ≤ 0,475) = 1,96. Para 90%, o valor crítico é P(0 ≤ z ≤ 0,45) = 1,64.
Substituindo os valores na equação:
Para um nível de confiança de 99%,
Portanto, o intervalo de confiança de 99% para a média de retorno do ativo é 3,12% ≤ μ ≤ 6,88%.
Para um nível de confiança de 95%,
Portanto, o intervalo de confiança de 95% para a média de retorno do ativo é 3,57% ≤ μ ≤ 6,43%.
Para um nível de confiança de 90%,
Portanto, o intervalo de confiança de 90% para a média de retorno do ativo é 3,80% ≤ μ ≤ 6,20%.
Observe que, à medida que existe uma relação inversa entre o nível de confiança e o tamanho do intervalo, quando o nível de confiança exigido é baixo, o tamanho do intervalo é pequeno. Porém, à medida que se exige uma maior confiança, o tamanho do intervalo aumenta.
Referência da aula
WALPOLE, Ronald E. et al. Probability & statistics for engineers & scientists. Pearson Prentice Hall, 2011.