Texto
Intervalo de confiança para a distribuição t de Student
A distribuição t de Student é uma distribuição de probabilidades muito semelhante à distribuição normal. É uma distribuição também em forma de sino e simétrica em relação a média. A grande diferença é que sua utilização é para os casos em que as amostras são pequenas e o desvio-padrão da população é desconhecido. Como consequência, temos uma curva em forma de sino em que as caudas são mais pesadas do que as caudas de uma distribuição normal, ou seja, os extremos estão sob probabilidades maiores. As caudas são mais finas quanto maiores os graus de liberdade, como pode ser observado na imagem abaixo.
Figura - Distribuição t de Student.
Fonte: Elaborada pelo autor.
A consequência disso é que ela é mais propensa a produzir valores que se distanciam da média. Dessa maneira, o ferramental estatístico para utilizá-la não é o mesmo de uma distribuição normal.
Teste t
Dada uma distribuição normal, aprendemos a padronizar valores amostrais em termos de Z para conhecer a probabilidade de ocorrência de determinados valores e também a calcular um intervalo de confiança para estudos estatísticos que se adequam às condições para a utilização da tabela Z. As condições, assumindo uma distribuição normal, são duas:
- amostras grandes, geralmente com n > 30;
- variância e desvio-padrão da população são conhecidos.
Quando essas condições não são respeitadas, usa-se o gráfico de distribuição T, para que através de um outro ferramental estatístico, o teste t de Student, sejam construídos os intervalos de confiança e avaliadas as significâncias estatísticas de maneira mais adequada. Vale citar que, para casos em que não se conhece o desvio-padrão da população mas a amostra é grande, os valores da tabela t se aproximam dos valores da tabela Z, de forma que a diferença entre utilizar uma e outra é pequena.
Condições para uso da distribuição t e teste t de Student:
- amostras pequenas;
- variância e desvio-padrão da população são desconhecidos
Como já aprendemos a construir o intervalo de confiança de uma distribuição normal com a tabela Z, ficará simples aprendermos a construí-lo com a tabela t. Para isso, vamos construir na prática um intervalo de confiança para média com uma amostra hipotética.
Exemplo:
A amostra {48, 53, 42, 67, 24, 54, 61, 73, 18, 52} foi extraída aleatoriamente de uma população que, sabe-se, respeita uma distribuição normal, e tem sua variância e seu desvio-padrão desconhecidos. Podemos, com essa amostra, calcular uma média. Mas podemos confiar que essa média estará próxima da média da população? Para sabermos isso, devemos construir um intervalo de confiança para essa média.
Os passos são apresentados a seguir.
Primeiramente, calculamos a média da amostra:
Após isso, calculamos a variância da amostra e seu desvio-padrão. Como temos a média, podemos realizar os cálculos necessários para o cálculo da variância, de forma a completar a tabela.
Tabela - Variância da amostra.
X | ||
48 | -0,10 | 0,01 |
53 | 4,90 | 24,01 |
42 | -6,10 | 37,21 |
67 | 18,90 | 357,21 |
24 | -24,10 | 580,81 |
54 | 5,90 | 34,81 |
61 | 12,90 | 166,41 |
73 | 24,90 | 620,01 |
18 | -30,10 | 906,01 |
41 | -7,10 | 50,41 |
Fonte: Elaborada pelo autor.
Basta agora somarmos os elementos da última coluna e dividirmos o resultado por (n-1), de acordo com a fórmula da variância para amostras:
Agora, para encontrarmos o desvio-padrão, basta que tiremos a raiz quadrada da variância:
Agora, com o auxílio da tabela de distribuição t de Student, vamos procurar o valor t. A tabela abaixo apresenta duas linhas superiores indicando o nível de confiança. Neste caso, vamos construir um intervalo de confiança ao nível de 95%. A linha lateral da esquerda representa os graus de liberdade, que é definido no teste por (n - 1). Portanto, como (n = 10) é o tamanho da nossa amostra, o número que devemos buscar nessa linha é (10 - 1 = 9). Cruzando as linhas guias, como mostrado pelas setas na tabela, chegamos ao valor de 2,262, o nosso valor t crítico que faltava para construirmos o intervalo de confiança através da fórmula que conheceremos a seguir.
Figura - Intervalo de confiança.
Fonte: Elaborada pelo autor.
Perceba que, como a distribuição é simétrica, quando falamos em 95% dos resultados possíveis, estamos falando que restarão nas caudas 5%, que serão divididos simetricamente nas duas caudas, ou seja, 2,5% em cada um do lados. É por essa razão que 95% para um teste bicaudal equivale a 97,5% para um teste unicaudal na tabela. Perceba ainda que a tabela aqui apresentada nos informa diretamente o nível de confiança, ou seja, a área que desejamos do gráfico, mas algumas tabelas podem apresentar o nível de confiança α. Neste caso, 95% - que é (1 - 0,05) - de confiança estaria indicado pelo valor 0,05 para o teste bicaudal e 0,025 para o teste unicaudal.
Entendido isso, podemos construir o intervalo de confiança com as informações que encontramos. A fórmula para o cálculo do intervalo é:
Assim, o limite inferior será:
E o limite superior será:
Assim, nosso intervalo de confiança é:
Concluímos que o intervalo de 95% de confiança para a média populacional é [35,53; 60,67].