Compreendendo a distribuição T

Publicado por Javier Ricardo

O que é uma distribuição T?


A distribuição T, também conhecida como distribuição t de Student, é um tipo de distribuição de probabilidade semelhante à distribuição normal com sua forma de sino, mas tem caudas mais pesadas.
Distribuições T têm uma chance maior de valores extremos do que distribuições normais, portanto, caudas mais grossas.


Principais vantagens

  • A distribuição T é uma distribuição de probabilidade contínua do z-score quando o desvio padrão estimado é usado no denominador em vez do desvio padrão verdadeiro.
  • A distribuição T, assim como a distribuição normal, é em forma de sino e simétrica, mas tem caudas mais pesadas, o que significa que tende a produzir valores que caem longe de sua média.
  • Os testes T são usados ​​em estatísticas para estimar a significância.

O que uma distribuição T lhe diz? 


O peso da cauda é determinado por um parâmetro da distribuição T chamado graus de liberdade, com valores menores resultando em caudas mais pesadas e com valores mais altos fazendo com que a distribuição T se assemelhe a uma distribuição normal padrão com uma média de 0 e um desvio padrão de 1. O A distribuição T também é conhecida como “Distribuição T do Aluno”.

Imagem

Imagem de Sabrina Jiang © Investopedia 2020


Quando uma amostra de n observações é retirada de uma população normalmente distribuída com média M e desvio padrão D, a média da amostra, m, e o desvio padrão da amostra, d, serão diferentes de M e D devido à aleatoriedade da amostra.


Um z-score pode ser calculado com o desvio padrão da população como Z = (x – M) / D, e este valor tem a distribuição normal com média 0 e desvio padrão 1. Mas ao usar o desvio padrão estimado, um t-score é calculado como T = (m – M) / {d / sqrt (n)}, a diferença entre d e D torna a distribuição uma distribuição T com (n – 1) graus de liberdade em vez da distribuição normal com média 0 e desvio padrão 1. 

Exemplo de como usar uma distribuição T


Veja o exemplo a seguir para saber como as distribuições t são utilizadas na análise estatística.
Primeiro, lembre-se de que um intervalo de confiança para a média é um intervalo de valores, calculado a partir dos dados, com o objetivo de capturar uma média da “população”. Este intervalo é m + – t * d / sqrt (n), onde t é um valor crítico da distribuição T.


Por exemplo, um intervalo de confiança de 95% para o retorno médio da Dow Jones Industrial Average nos 27 dias de negociação anteriores a 11/9/2001 é -0,33%, (+/- 2,055) * 1,07 / sqrt (27), dando um retorno médio (persistente) como algum número entre -0,75% e + 0,09%.
O número 2.055, a quantidade de erros padrão pelos quais ajustar, é encontrado na distribuição T.


Como a distribuição T tem caudas mais grossas do que uma distribuição normal, ela pode ser usada como um modelo para retornos financeiros que exibem curtose excessiva, o que permitirá um cálculo mais realista do Valor em Risco (VaR) em tais casos.

A diferença entre uma distribuição T e uma distribuição normal 


Distribuições normais são usadas quando a distribuição da população é considerada normal.
A distribuição T é semelhante à distribuição normal, apenas com caudas mais grossas. Ambos assumem uma população normalmente distribuída. As distribuições T têm curtose mais alta do que as distribuições normais. A probabilidade de obter valores muito distantes da média é maior com uma distribuição T do que com uma distribuição normal.

Limitações do uso de uma distribuição T 


A distribuição T pode distorcer a exatidão em relação à distribuição normal.
Sua deficiência só surge quando há necessidade de uma normalidade perfeita. No entanto, a diferença entre usar uma distribuição normal e uma distribuição T é relativamente pequena.