Páginas

03 setembro 2021

Planilha Excel faz mudança importante na Genética - 2

 No ano passado postamos sobre um problema que a utilização da planilha Excel, por parte dos cientistas da área de saúde, estavam tendo:

Os cientistas que estudam o genoma humano resolveram fazer uma mudança por conta da planilha Excel. Cerca de 27 genes humanos foram renomeados. Tudo isto porque a planilha interpreta de forma errada os símbolos como datas. Parece um problema pequeno, mas não é.

O Excel é muito usado pelos cientistas (e pelos contadores). O problema é que suas configurações são ajustadas para aplicações mais comuns. Assim, quando um cientista insere

um símbolo alfanumérico de um gene em uma planilha, como MARCH1 - abreviação de " Membrane Associated Ring-CH-Type Finger 1 " - o Excel converte isso em uma data: 1 de março

Apesar da mudança do nome, para evitar este problema, parece que o problema persiste:

Com dados científicos, o simples ato de abrir um arquivo no Excel com as configurações padrão pode corromper os dados devido à correção automática. É possível evitar a correção automática indesejada se as células forem pré-formatadas antes de colar ou importar dados, mas essa e outras dicas de higiene de dados não são amplamente praticadas.

(...) Vários anos atrás, detectamos esse erro em arquivos de dados suplementares anexados a um artigo de jornal de alto impacto e ficamos interessados em quão difundidos esses erros são. Nosso artigo de 2016 indicou que o problema afetava periódicos de nível médio e alto a taxas aproximadamente iguais. Isso nos sugeriu que pesquisadores e periódicos desconheciam amplamente o problema de autocorreção e como evitá-lo.

Como resultado de nosso relatório de 2016, o Human Gene Name Consortium, o órgão oficial responsável pela nomeação de genes humanos, renomeou os genes mais problemáticos. MARÇO1 e SEPT1 foram alterados para MARÇO1 e SEPTIN1 respectively, e others had similar changes.

No início deste ano nós repetimos nossa análise. Neste tempo, nós expandimos [a análise] para cobrir uma maior seleção de periódicos (...)

Ficamos chocados ao descobrir no período de 2014 a 2020 que 3.436 artigos, cerca de 31% da nossa amostra, continham erros de nome de gene. [gráfico]



Acreditamos que os erros são importantes porque levantam questões sobre como esses erros podem se infiltrar em publicações científicas. Se os erros de correção automática de nomes de genes puderem passar a revisão por pares sem serem detectados nos arquivos de dados publicados, que outros erros também podem estar à espreita entre os milhares de pontos de dados?

Catástrofes de planilhas

Nas finanças e de negócios, existem muitos exemplos de erros de planilha perdas caras e embaraçosas.

Em 2012, o JP Morgan declarou uma perda de mais de US $ 6 bilhões, graças a uma série de erros comerciais possibilitados erros de fórmula em suas planilhas de modelagem. Análise de milhares de planilhas na Enron Corporation, antes de sua queda espetacular em 2001, mostra quase um quarto continha erros.

Um artigo, agora infame, das economistas de Harvard, Carmen Reinhart e Kenneth Rogoff, foi usado para justificar cortes de austeridade após a crise financeira global, mas a análise continha um erro crítico do Excel, isso levou a omitir cinco dos 20 países em sua modelagem.

Apenas no ano passado, a erro de planilha na Public Health England levou à perda de dados correspondente a cerca de 15.000 casos positivos de COVID-19. Isso comprometeu os esforços de rastreamento de contatos por oito dias, enquanto os números de casos estavam crescendo rapidamente. No ambiente de saúde, erros de entrada de dados clínicos em planilhas pode chegar a 5%, enquanto um separado estudo de planilhas de administração hospitalar mostrou 11 de 12 falhas críticas.(...)

Nenhum comentário:

Postar um comentário