Translate

14 outubro 2021

Planilha e outros usos


 Ainda Tim Harford:

As planilhas originais em papel foram projetadas para nos ajudar a não perder o rumo, e pode-se imaginar naturalmente que a planilha digital não é apenas mais rápida, mas mais precisa. É isso? Uma pista vem de um maravilhoso estudo realizado por Felienne Hermans, uma cientista da computação. Alguns anos atrás, Hermans percebeu que havia uma fonte abundante de planilhas que ela poderia estudar. Essa fonte era a Enron, a empresa de energia falida.

Depois que a Enron entrou em colapso em 2001 em meio a um escândalo contábil épico, os reguladores extraíram um cache de meio milhão de e-mails dos servidores da empresa. Esses e-mails estão agora disponíveis ao público e foram estudados por pesquisadores que tentam entender tudo, desde a evolução da linguagem escrita informal até a maneira como as pessoas usam pastas de e-mail. Hermans estava interessado no que foi anexado a alguns desses e-mails: planilhas.

Ela começou a vasculhá-los, sem procurar fraudes, mas por planilhas com erros óbvios, como referências ausentes ou circulares. Observando quase 10.000 planilhas com cálculos, ela descobriu que um quarto tinha pelo menos um desses erros. Os erros pareciam se multiplicar. Se uma planilha tivesse algum erro, em média ela continha mais de 750.

Como uma planilha pode adquirir tantos erros? Matt Parker, o autor de Humilde Pi, um livro sobre contratempos matemáticos e suas conseqüências, observa que a funcionalidade do Excel combinada com as suposições equivocadas dos usuários geralmente introduz erros.

Digite um número de telefone internacional no Excel, por exemplo, e o programa retira os zeros principais, que são redundantes em um número inteiro matemático, mas não em um número de telefone. Se você digitar um número de série de vinte dígitos, o Excel decidirá que esses 20 dígitos são uma quantidade enorme e os arredondará, transformando os últimos dígitos em zeros.

Ou diga que você é um pesquisador de genética digitando o nome de um gene como "Dinger 1 associado ao anel associado à membrana" ou 1 de março, ou talvez o gene 1 de setembro. Você pode imaginar o que o Excel faz a seguir. Transforma esses nomes de genes em datas. Um estudo estimou que 20% de todos os artigos de genética tiveram erros causados pela autocorreção do Excel.

A defesa da Microsoft é bastante simples: as configurações padrão devem funcionar nos cenários diários. Qual é a maneira educada de dizer: Gente, o Excel não foi projetado para pesquisadores de genética. Foi projetado para contadores. (grifo do blog)

Mas é compreensível que os cientistas tenham escolhido o Excel e tenham começado a usá-lo. É poderoso, é flexível. É onipresente. Pode não ser a ferramenta certa, mas é a ferramenta que está ali.

Quando usado por um contador treinado para realizar a contabilidade de entrada dupla, um sistema estabelecido há muito tempo com detecção de erros embutida, o Excel é uma ferramenta perfeitamente profissional. Mas quando pressionado a serviço por pesquisadores de genética ou rastreadores de contatos, é como usar o canivete suíço para caber em uma cozinha, porque é a ferramenta que você tem mais próximo. Não é impossível, mas dificilmente aconselhável.

E, no entanto, quando a comunidade de pesquisa genética estava lutando com a questão dos genes que corrigia a autocorreção, eles se resignaram à dura verdade de que nunca afastariam as pessoas do Excel. Em vez disso, os responsáveis - o Comitê de Nomenclatura de Gene - decidiram mudar os nomes dos genes em questão.

A decisão é compreensível. Mas também ilustra claramente as contorções pelas quais passamos como resultado do tratamento de dados como uma reflexão tardia, apenas algo para bater juntos em uma planilha. Isso é uma pena, porque a história sugere que informações bem gerenciadas podem ser transformadoras.

Foto: aqui

Nenhum comentário:

Postar um comentário