Viés de seleção de amostra

Publicado por Javier Ricardo

O que é viés de seleção de amostra?


O viés de seleção de amostra é um tipo de viés causado pela escolha de dados não aleatórios para análise estatística.
O viés existe devido a uma falha no processo de seleção da amostra, em que um subconjunto dos dados é sistematicamente excluído devido a um atributo específico. A exclusão do subconjunto pode influenciar a significância estatística do teste e pode enviesar as estimativas dos parâmetros do modelo estatístico.

Compreendendo o viés de seleção da amostra


O viés de sobrevivência é um tipo comum de viés de seleção de amostra.
Por exemplo, ao testar uma estratégia de investimento em um grande grupo de ações, pode ser conveniente procurar títulos que tenham dados para todo o período da amostra. Se fôssemos testar a estratégia com base em 15 anos de dados de ações, poderíamos procurar ações que tenham informações completas para o período inteiro de 15 anos. No entanto, a eliminação de uma ação que parou de ser negociada, ou logo deixou o mercado, colocaria um viés em nossa amostra de dados. Como incluímos apenas ações que duraram o período de 15 anos, nossos resultados finais seriam falhos, pois tiveram um desempenho bom o suficiente para sobreviver ao mercado.


Os índices de desempenho de fundos de hedge são um exemplo de viés de seleção de amostra sujeito ao viés de sobrevivência.
Como os fundos de hedge que não sobrevivem param de relatar seu desempenho aos agregadores de índice, os índices resultantes são naturalmente inclinados para fundos e estratégias que permanecem, portanto, “sobrevivem”. Isso também pode ser um problema com os serviços de relatórios de fundos mútuos populares.


Os analistas podem se ajustar para levar em conta esses vieses, mas podem introduzir novos vieses no processo.