Texto
Distribuição uniforme discreta
Uma variável possui distribuição uniforme discreta quando os valores finitos em um intervalo recebem a mesma chance de ocorrer, ou seja, entre n valores possíveis, cada um recebe a probabilidade 1/n. Um exemplo é o lançamento de um dado: os valores possíveis são {1; 2; 3; 4; 5; 6}, e cada valor possui probabilidade de 1/6:
Figura – Distribuição uniforme discreta do lançamento de um dado (função massa de probabilidade).
Fonte: Elaborada pelo autor.
Se a é o valor mínimo e b é o valor máximo da distribuição uniforme discreta, n = b - a + 1 e a média será . No lançamento de um dado, por exemplo, n é igual a 6 - 1 + 1 = 6 e a média é (1+6)/2 = 3,5.
Distribuição uniforme contínua
Uma variável possui distribuição uniforme contínua quando todos os valores no intervalo [a,b] recebem a mesma chance de ocorrer. Supondo que os valores em questão pertençam ao intervalo entre 0 e 9, a distribuição de probabilidade será dada como na figura abaixo:
Figura – Distribuição uniforme contínua (função densidade de probabilidade).
Fonte: Elaborada pelo autor.
Em que a é o valor mínimo e b é o valor máximo da distribuição. 1/(b-a) é a função densidade de probabilidade, e portanto altura de todos os pontos entre a e b da distribuição uniforme. A média e a variância de uma distribuição uniforme contínua é dada pelas fórmulas:
Na imagem acima a = 0 e b = 9, e então a média é (0 + 9)/2 = 4,5 e a variância é igual a (9 - 0)²/12 = 6,75.
A função de distribuição cumulativa para a distribuição uniforme, com, por exemplo, valores de k dentro do intervalo [a, b], é expressa como:
Exemplo: Um valor é escolhido entre 0 e 2. Qual é a probabilidade de esse valor estar entre 1 e 3/2?
Intuitivamente, podemos ver que a distribuição cumulativa quando k = 1 é 1/2 ou 50%, pois se a = 0 e b = 2, andamos por metade da distribuição até chegar no 1. Matematicamente:
Igualmente, de a = 0 até k = 3/2 em uma distribuição com final em b = 2, andamos 3/4 do caminho:
A probabilidade de acharmos um valor entre 1 e 3/2, P(1 ≤ x ≤ 3/2), será a função cumulativa de 3/2 menos a função cumulativa de 1:
Generalizando, a probabilidade de um valor estar entre c e d é:
Distribuição binomial
A distribuição binomial (com parâmetros n e p) é a distribuição de probabilidade discreta de um número de sucessos em uma sequência de n experimentos independentes com probabilidade de ocorrência p. A distribuição binomial é frequentemente usada para modelar o número de sucessos em uma amostra de tamanho n desenhada com substituição de uma população de tamanho N. Em geral, se a variável aleatória X segue a distribuição binomial com os parâmetros n ∈ ℕ e p ∈ [0,1], escrevemos X ~ B (n, p).
Figura – Distribuição binomial (função massa de probabilidade).
Fonte: Elaborada pelo autor.
A função massa de probabilidade da distribuição é dada pela seguinte fórmula:
Em que n é o número total de jogadas, p é a probabilidade de sucesso, P(X = k) é a probabilidade de ter sucesso em exatamente k tentativas e:
Exemplo: Considere o lançamento de uma moeda justa, em que o resultado de sucesso é "cara". Se lançarmos a moeda 10 vezes, qual a probabilidade de observarmos a face "cara" 8 vezes?
Sabendo que k = 8, n = 10 e a probabilidade de sucesso p é 50%:
Assim, a probabilidade de dar "cara" em 8 de 10 lançamentos é 4,39%. Como em outras distribuições, é possível obter o valor da média e da variância de uma distribuição binomial, sendo que as fórmulas para média e variância são:
Existe um caso especial da distribuição binomial, conhecido como distribuição de Bernoulli, onde n=1. Assim as fórmulas para média e variância serão:
Aproximação da distribuição binomial pela normal
Em algumas situações, é possível utilizar a distribuição normal como uma aproximação da distribuição binomial, de forma que pode-se utilizar a tabela z. Essa situação é útil para quando calcula-se a probabilidade de um intervalo de acontecimentos quando n, número de experimentos independentes, é grande. Para isso, deve-se atender uma das seguintes condições:
Considere o seguinte: uma moeda honesta (p = 50%) é lançada 30 vezes em idênticas condições. Qual a probabilidade de tirar cara mais de 20 vezes?
Uma forma de calcular seria somar as probabilidades de ocorrência de tirar cara acima de 20 vezes:
P(X>20) = P(X=21) + P(X=22) + ... + P(X=29) + P(X=30)
Entretanto, utilizando o cálculo de probabilidade cada evento pela distribuição binomial faz com que esse seja um processo lento. Utilizando a aproximação pela distribuição normal, calcula-se a média e o desvio padrão. Utilizando as fórmulas:
Após isso, pode-se calcular o valor Z:
Assim, P(X>20) = P(Z>1,82). Consultando a distribuição normal pela tabela Z, o valor obtido é de 0,0344. Portanto:
P(X>20) = P(Z>1,82) = 0,0344 = 3,44%
Distribuição log-normal
Uma variável aleatória X tem distribuição log-normal se sua função densidade de probabilidade for dada por:
em que μ ∈ ℝ é a média do logaritmo do tempo de falha e σ > 0 é o desvio-padrão.
Figura – Distribuição log-normal (função densidade de probabilidade).
Fonte: Elaborada pelo autor.
Assim como a distribuição normal aparece quando as variáveis são somadas (pelo teorema do limite central), a distribuição log-normal aparece quando as variáveis (positivas) são multiplicadas.
Na modelagem de preço de ativos, o preço de uma ação no futuro pode ser modelado como o efeito de vários pequenos ajustes independentes, ou seja:
Ou seja, aplicando o log, tem-se que log Pn é a soma de várias variáveis aleatórias independentes, ou seja, pode ser aproximado por uma distribuição normal. Nesse sentido, Pn pode ser aproximado por uma log-normal.
Utilização da distribuição log-normal na modelagem de preços de ativos
A distribuição log-normal é uma distribuição flexível relacionada com a distribuição normal, e que é bastante útil para modelar dados que são mais ou menos simétricos ou assimétricos à direita. É um modelo que geralmente é utilizado para aplicações de alta tecnologia. Sua distribuição é baseada no modelo de crescimento multiplicativo. Como as variáveis aleatórias log-normais assumem apenas valores positivos, são úteis para modelar preços e cotações em geral.
Na modelagem dos retornos de ações, é utilizado o log-retorno, ou retorno geométrico. Hull (2009) fornece um modelo para o comportamento de preço das ações. O modelo é basicamente um processo estocástico de Markov do tipo dS = μSdt + σSdz.
Esse processo é também conhecido como movimento browniano geométrico, que resumidamente significa que tanto o percentual esperado da ação bem como a volatilidade do retorno percentual é constante e independe do valor absoluto do preço. Dessa forma, considerando que uma ação esteja precificada a R$ 20,00 ou R$40,00, o retorno percentual esperado e a volatilidade deste retorno são os mesmos nos dois casos, ceteris paribus. Considerando assim, que sejam suposições verdadeiras, o retorno dos preços obedeceria a uma distribuição log-normal (log-retornos dos preços seguem uma distribuição normal).
Distribuição t de Student
A distribuição t de Student é qualquer membro de uma família de distribuições contínuas de probabilidade que se origina ao estimar a média de uma população normalmente distribuída em situações em que o tamanho da amostra é pequeno e o desvio-padrão da população não é conhecido. A distribuição t desempenha um papel importante na estatística devido ao teste t de Student, que é utilizado para avaliar a significância estatística e a construção dos intervalos de confiança.
Figura – Distribuição t de Student (função densidade de probabilidade).
Fonte: Elaborada pelo autor.
A distribuição t é simétrica e em forma de sino, como a distribuição normal, mas tem caudas mais pesadas caso o grau de liberdade (gl) seja pequeno, e, portanto, é mais propensa a produzir valores que se afastam da sua média.
Referência da aula
HULL, John C. Options, Futures, and Other Derivatives. 7th edition. Pearson Education International. 2009.