Quando fazemos pesquisas com dados é comum encontrarmos alguma informação bastante diferente das demais. Chamamos de valores extremos ou outliers. Existem várias técnicas para identificar cientificamente um outlier, que o leitor pode encontrar num livro de estatística, como por exemplo, o teste de Mahalanobis.
A grande dúvida para o pesquisador é se deve-se retirar ou não este dado. Ao retirar, os resultados estatísticos geralmente ficam melhores. Isto é um ponto positivo interessante a ser considerado. Mas o conforto pode ser punido por desprezar uma informação que pode ser útil. Os pesquisadores financeiros devem lembrar os valores extremos do comportamento do mercado acionário. Estes valores serviram de alerta para Nassim Taleb, que em lugar de ver “outliers” enxergou um comportamento que poderia levar a decisões ruins.
Além disto, o outlier pode ser a base de uma pesquisa. No passado fiz uma pesquisa com uma orientanda sobre o impacto do trânsito no mercado acionário de São Paulo. Depois de investigar a lentidão do trânsito na cidade de São Paulo, selecionamos os dias onde a informação era outlier. Ou seja, os dias de “muito caos” no trânsito. Com esta informação de outlier, comparamos com os dias de “caos”, ou seja, os dias normais no trânsito de São Paulo. Neste caso, a escolha do outlier era a essência da pesquisa. Sua determinação servia de propósito para verificar os efeitos na situação extrema.
Concluindo, o outlier pode ser uma importante informação para uma pesquisa. Antes de eliminar, verifique se você realmente não consegue aprender um pouco mais com este valor extremo.
Assinar:
Postar comentários (Atom)
Nenhum comentário:
Postar um comentário