Este [O elefante na sala: p-hacking e pesquisa contábil] é o título deste novo artigo de Ian D. Gow, professor de contabilidade na Universidade de Melbourne, que conclui que a maioria das descobertas publicadas nas principais revistas em seu campo são de valor duvidoso, se não inúteis. Por quê? Porque muitos pesquisadores em contabilidade se envolvem em manipulação de dados desenfreada ou p-hacking, se acreditarmos em Gow. (...) se a conjectura de Gow estiver correta - se esses métodos precários forem o "modo dominante de pesquisa em contabilidade acadêmica" - então significaria que a maioria das pesquisas em contabilidade é, para citar Gow, "um exercício em grande parte inútil" ou de "valor limitado" no máximo. (...)
22 outubro 2023
Qualidade questionável das pesquisas contábeis
Este [O elefante na sala: p-hacking e pesquisa contábil] é o título deste novo artigo de Ian D. Gow, professor de contabilidade na Universidade de Melbourne, que conclui que a maioria das descobertas publicadas nas principais revistas em seu campo são de valor duvidoso, se não inúteis. Por quê? Porque muitos pesquisadores em contabilidade se envolvem em manipulação de dados desenfreada ou p-hacking, se acreditarmos em Gow. (...) se a conjectura de Gow estiver correta - se esses métodos precários forem o "modo dominante de pesquisa em contabilidade acadêmica" - então significaria que a maioria das pesquisas em contabilidade é, para citar Gow, "um exercício em grande parte inútil" ou de "valor limitado" no máximo. (...)
04 maio 2023
12 setembro 2022
Mechanical Turk e o problema do p-hacking
Na postagem sobre p-hacking e o viés da publicação, onde mostramos uma pesquisa que verificou se procedimentos de registro de análise prévia poderia resolver este problema, a boa notícia é que um dos procedimentos, o PAP, pode ser uma possível resposta para a questão. Lembrando que p-hacking é a tendência a forçar um resultado que torna a pesquisa com mais chance de ser publicada ou de ser citada. E o viés da publicação é o fato de que editores e pareceristas de periódicos terem uma preferência prévia por certos resultados, afetando a decisão de aceite de um artigo.
Em um exemplo, é mais "publicável" um estudo que afirma que um alimento pode ajudar a reduzir uma doença do que outra pesquisa que diz não existir nenhuma relação. A nossa postagem mostrou que fazendo fazendo um registro prévio das hipóteses e da forma como a questão será abordada na pesquisa pode ajudar a resolver o p-hacking e o viés da publicação.
Três dos quatro autores do estudo que descrevemos na postagem analisaram também o Mechanical Turk. Para quem não conhece, é uma ferramenta de propriedade da Amazon que tem sido muita usada em pesquisas em diversas áreas. Sua grande vantagem é permitir que uma pesquisa seja realizada com um universo de respondentes demograficamente mais diverso, sendo possível obter grandes amostras com baixo custo.
Analisando os estudos publicados entre 2010 e 2020, os autores constataram que a amostra dos estudos é relativamente baixa (média de 249 respondentes). Em uma das notas de rodapé da pesquisa há um caso interessante de um estudo realizado em 2013 em que cinco anos depois o líder não se lembrava de nada do experimento com 956 participantes. Isto seria um sinal de que o MTurk apresenta um baixo custo de oportunidade: se a pesquisa tivesse sido presencial, você iria lembrar de algo, já que seu custo de aplicação é elevado.
O resultado final é que pesquisas que usam o MTurk possuem p-hacking, viés de publicação e confiança excessiva nos resultados. O próprio comportamento da comunidade de responde pode afetar o resultado.
Eis o abstract:
Amazon Mechanical Turk is a very widely-used tool in business and economics research, but how trustworthy are results from well-published studies that use it? Analyzing the universe of hypotheses tested on the platform and published in leading journals between 2010 and 2020 we find evidence of widespread p-hacking, publication bias and over-reliance on results from plausibly under-powered studies. Even ignoring questions arising from the characteristics and behaviors of study recruits, the conduct of the research community itself erode substantially the credibility of these studies’ conclusions. The extent of the problems vary across the business, economics, management and marketing research fields (with marketing especially afflicted). The problems are not getting better over time and are much more prevalent than in a comparison set of non-online experiments. We explore correlates of increased credibility
Eis um gráfico que diz tudo sobre o MTurk:
Esta é a curva dos resultados da estatística Z. A curva deveria está em formato decrescente - caso as pesquisas não tivessem problemas.
(Uma curiosidade: o MTurk tem este nome em homenagem da Edgar Allan Poe. Na sua época, apareceu uma máquina que jogava xadrez, um robô, representado por um turco. Poe é do século XIX, então esta máquina era um truque. O escritor relata como a "maquina" funcionava)
08 setembro 2022
Uma possível solução para o p-hacking e o viés da publicação
O gráfico mostra que o registro prévio nos periódicos de economia estão crescendo substancialmente. E entre os periódicos mais relevantes isto parece ser uma regra básica. Os outros periódicos estão acompanhando a onda.
Como o pré-registro e o PAP são procedimentos distintos, a pesquisa analisou ambos. O gráfico acima mostra a distribuição dos testes estatísticos para a primeira situação, ou seja, do pré-registro. Na verdade, o gráfico da esquerda é a pesquisa sem pré-registro e o gráfico da direito é com o pré-registro. Se você achou que os gráficos parecem iguais, sua impressão é correta. Será que isto muda com um maior rigor, ou seja, com o PAP? O resultado está abaixo:Os dois gráficos podem parecer idênticos, mas quando os autores analisaram os testes para verificar a presença de p-hacking o resultado mostrou que são estatisticamente diferentes.