Nas pesquisas científicas quantitativas é comum usar como critério de decisão 0,05. Há controvérsias sobre quem foi o autor que endosso o uso de 0,05 como padrão para significância estatística (Aqui há uma boa discussão sobre isto). Nos últimos anos muitos cientistas são críticos com respeito a este padrão “sagrado”: “Certamente Deus ama 0,06 quase tanto quanto 0,05” (Rosenthal)
Nos tempos atuais, as pesquisas buscam de forma obsessiva o 0,05 e isto termina por conduzir a práticas como o p-hacking e a tortura dos dados. A defesa do abandono do uso do p-valor em pesquisa é uma consequência; alguns estatísticas (acho de Gelman é um deles) defendem que o pesquisa apresente os resultados e deixe a conclusão para o leitor. Os métodos bayesianos são citados como alternativas.
Uma ideia interessante é mudar o padrão: em lugar dos 0,05,que corresponde a uma estatística t de 1,96, utilizar um padrão que excede em muito este valor. Harvey, Liu e Zhu, em 2016, sugeriram uma estatística t igual a 3. Outros, a um p-valor de 0,005 ou uma estatística t de 2,81.
Qual seria a consequência disto? Muitas pesquisas empíricas publicadas nos últimos anos teriam seus resultados contestados, como mostra Baltussen, Swinkels e Vliet. Mais do que isto, muitos periódicos gostam de publicar pesquisas com resultados que sejam “interessantes” em termos estatísticos; o número destas pesquisas “publicáveis” reduziria substancialmente.
Harvey, Campbell; Liu, Yan; Zhu, Heqing. ... and the Cross-Section of Expected Returns. ssrn.com/abstract-2249314
Baltussen, Guido; Swinkels, Laurens; Van Vliet, Pim. Global Factor Premiums. ssrn.com/abstract=3325720
Nenhum comentário:
Postar um comentário