29 fevereiro 2024
28 fevereiro 2024
Mais da metade do conteúdo da internet foi gerado por IA
Eis o abstract:
We show that content on the web is often translated into many languages, and the low quality of these multi-way translations indicates they were likely created using Machine Translation (MT). Multi-way parallel, machine generated content not only dominates the translations in lower resource languages; it also constitutes a large fraction of the total web content in those languages. We also find evidence of a selection bias in the type of content which is translated into many languages, consistent with low quality English content being translated en masse into many lower resource languages, via MT. Our work raises serious concerns about training models such as multilingual large language models on both monolingual and bilingual data scraped from the web.
O artigo é proveniente de funcionários da Amazon e pode ser encontrado aqui. O gráfico a seguir mostra o resultado por língua (português, pt, na parte esquerda)
O impressionante é que das frases analisadas, 57,1% foram traduzidas para dois ou mais idiomas. A cada tradução, a qualidade piora. Os pesquisadores acreditam que um texto básico de inglês é usado para outros idiomas e este material é traduzido cada vez mais. E como a IA depende de material de boa qualidade para treinamento, o que temos hoje talvez seja ruim para os algoritmos mais avançados.
27 fevereiro 2024
Explorando a Complexa Relação entre Renda e Crime
É bem conhecido que pessoas com renda mais baixa cometem mais crimes. Chame isso de resultado transversal. Mas por quê? Um conjunto de explicações sugere que é precisamente a falta de recursos financeiros que causa crime. De forma simplificada, talvez pessoas mais pobres cometam crimes para obter dinheiro. Ou, pessoas mais pobres enfrentam maiores pressões - raiva, frustração, ressentimento - o que as leva a agir ou pessoas mais pobres vivem em comunidades menos integradas e bem policiadas ou pessoas mais pobres têm acesso a piores cuidados médicos ou educação e assim por diante, o que leva a mais crime. Essas teorias implicam todas que dar dinheiro às pessoas reduzirá sua taxa de criminalidade.
Um conjunto diferente de teorias sugere que a correlação negativa entre renda e crime (mais renda, menos crime) não é causal, mas é causada por uma terceira variável correlacionada tanto com renda quanto com crime. Por exemplo, um QI mais alto ou maior conscienciosidade poderia aumentar a renda enquanto reduz o crime. Essas teorias implicam que dar dinheiro às pessoas não reduzirá sua taxa de criminalidade.
As duas teorias podem ser distinguidas por um experimento que aloca dinheiro aleatoriamente. Em um artigo notável, Cesarini, Lindqvist, Ostling e Schroder relatam os resultados de um experimento desses na Suécia.
Cesarini et al. observam suecos que ganham na loteria e comparam suas taxas subsequentes de criminalidade com não-ganhadores semelhantes. O resultado básico é que, se alguma coisa, há um leve aumento na criminalidade ao ganhar na loteria, mas, mais importante ainda, os autores podem rejeitar estatisticamente que a maior parte do resultado transversal seja causal. Em outras palavras, como aumentar aleatoriamente a renda de uma pessoa não reduz sua taxa de criminalidade, o primeiro conjunto de teorias é falsificado.
Algumas observações. Primeiro, você pode objetar que os jogadores de loteria não são uma amostra aleatória. No entanto, uma parte substancial dos dados de loteria de Cesarini et al. vem de contas de poupança vinculadas a prêmios, contas de poupança que pagam grandes prêmios em troca de pagamentos de juros mais baixos. As contas de poupança vinculadas a prêmios são comuns na Suécia e cerca de 50% dos suecos têm uma conta PLS. Assim, os jogadores de loteria na Suécia parecem bastante representativos da população. Em segundo lugar, Cesarini et al. têm dados sobre cerca de 280 mil ganhadores da loteria e têm o universo de condenações criminais; isto é, qualquer condenação de um indivíduo com 15 anos ou mais de idade de 1975 a 2017. Uau! Em terceiro lugar, algumas pessoas podem objetar que a correlação que observamos é entre condenações e renda e talvez as condenações não reflitam o crime real. Não acho que isso seja plausível por várias razões, mas os autores também não encontram evidências estatisticamente significativas de que a riqueza reduza a probabilidade de alguém ser suspeito em uma investigação criminal (Deus abençoe os suecos pela coleta de dados extremos). Em quarto lugar, a análise foi pré-registrada e correções são feitas para testes de hipóteses múltiplas. Preocupo-me um pouco com o fato de que os ganhos na loteria, na sua maioria, são da ordem de 20 mil ou menos e gostaria que os autores tivessem falado mais sobre o seu tamanho em relação às diferenças transversais. No entanto, no geral, este parece ser um artigo muito credível.
Em seu resultado mais importante, mostrado abaixo, Cesarini et al. convertem ganhos na loteria em choques de renda permanente equivalentes (usando uma taxa de juros de 2% ao longo de 20 anos) para estimar causalmente o efeito de choques de renda permanente sobre o crime (quadrados sólidos abaixo) e eles comparam com os resultados transversais para jogadores de loteria em sua amostra (círculo) ou pessoas similares na Suécia (triângulo). Os resultados transversais são todos negativos e diferentes de zero. Os resultados causais da loteria são na maioria positivos, mas nenhum rejeita zero. Em outras palavras, aumentar aleatoriamente a renda das pessoas não reduz sua taxa de criminalidade. Assim, a correlação negativa entre renda e crime deve-se a uma terceira variável. Como os autores resumem de forma bastante modesta:
Embora nossos resultados não devam ser extrapolados casualmente para outros países ou segmentos da população, a Suécia não se destaca por taxas de criminalidade particularmente baixas em relação a países comparáveis, e a taxa de criminalidade em nossa amostra de jogadores de loteria é apenas ligeiramente menor do que na população sueca em geral. Além disso, há uma forte relação negativa transversal entre crime e renda, tanto em nossa amostra de jogadores de loteria suecos quanto em nossa amostra representativa. Nossos resultados, portanto, desafiam a visão de que a relação entre crime e status econômico reflete um efeito causal de recursos financeiros sobre a delinquência adulta.
Fonte: Marginal Revolution (negrito meu).
26 fevereiro 2024
Como Decidir
Comecei a ler o livro Como Decidir e inicialmente não gostei. O estilo de deixar espaços em branco para que o leitor faça “exercícios” pareceu meio bobo. E realmente quase não fiz as tarefas que Anne Duke sugere ao leitor. Mas gostei muito do que li e recomendo a obra. E o principal motivo é que Duke apresenta conselhos que parecem óbvios, mas você fica pergunta, depois de ler um monte de livros, qual a razão de nunca ter pensado sobre o assunto.
Eis um pequeno exemplo. Duke mostra, logo na página 3, que qualidade de decisão e qualidade de resultado são coisas similares, mas não são iguais. Nós temos a tendência a achar que uma decisão foi boa em razão do seu resultado e isso não é verdade. Imaginei um exemplo aqui: você comprou um bilhete de loteria. Se você analisar sob a ótica da probabilidade a sua decisão foi péssima. Mas eis que você foi sorteado. O resultado foi ótimo, mas sua decisão não. As vezes tomamos decisões ruins e tudo acaba bem. Isso é pura sorte, como ela deixa claro no livro.
Há também a possibilidade de tomar uma boa decisão e o resultado ser ruim, o que é um azar. Você recusou a entrar no bolão da loteria dos colegas e o número foi sorteado; seus colegas ganharam o prêmio, você não. É o azar. Outro ensinamento muito valioso do livro: nós sabemos coisas antes da decisão e sabemos coisas depois do resultado.
A decisão do jogador Alex Sandro que avançar ao ataque, no jogo da Copa do Mundo de 2022 contra a Croácia, teve consequências que hoje sabemos. Mas sabemos porque temos o resultado do jogo. Há muito o que aprender no livro. Logo após ter completado a leitura deste livro, tomei a coragem de ler Pensar em Apostas, também de Duke. Eu gostei muito mais desta obra. Assim, se tiver que escolher um livro para ler, opte por este.
Livro: Mindshift
Falsidade
De um longo artigo de Tim Harford sobre falsificação:
Considere uma nova análise no Journal of Experimental Psychology dos psicólogos Ariana Modirrousta-Galian e Philip Higham. Eles examinam jogos como Bad News e Go Viral!, desenvolvidos por pesquisadores da Universidade de Cambridge para ajudar a "inocular" as pessoas contra notícias falsas. E funcionam, até certo ponto. Após jogar esses jogos, os sujeitos experimentais são de fato mais propensos a identificar notícias falsas como falsas. Infelizmente, eles também são mais propensos a identificar histórias de notícias genuínas como falsas. Sua capacidade de discriminar entre verdadeiro e falso não melhora. Em vez disso, eles se tornam mais cínicos sobre tudo.
O texto é sobre o falsificador Eric Hebborn, mas este trecho achei bem interessante.