Translate

27 setembro 2018

Efeito da Tradução na nossa vida

A popularização dos programas que permitem a tradução de um texto, como o Translate, tem alterado substancialmente a nossa vida. Recentemente fiz um curso de línguas onde a professora lutava contra os alunos que usavam o celular em sala para obter as traduções. A professora argumentava que o aluno deveria aprender a usar o cérebro para pensar na outra língua.

Durante a Copa do Mundo, o uso do Translate aumentou pois os fãs queriam iniciar conversas com os anfitriões ou com outros fás do mundo. Havia uma demanda elevada pelas palavras “estádio” e “cerveja”.

Apesar da melhoria substancial dos aplicativos, seus resultados podem ainda deixar a desejar. Dois problemas podem ocorrer. As palavras estão dentro de um contexto e o software pode entender errado. Um texto do Journal of Accountancy traduziu o nome do presidente do Fasb, Russell Golden, de tal forma que o título “2 new members appointed to FASB as Golden remains chairman” ficou como “2 novos membros nomeados para o FASB como presidente dos restos mortais de ouro”. Outro ponto é que uma palavra pode ter mais de um significado, e a tradução adequada vai depender do contexto. A música Blue, de LeAnn Rimes, começa com “Blue, Oh, so lonesome for you. Why can´t you be blue over me?”. No translate ficou: “Azul, oh, tão solitário por você. Por que você não pode ser azul por cima de mim?”. O Translate traduziu “blue” como azul, mas a palavra também pode ser “triste”. (Tudo bem, a tradução de músicas e poesias é bem mais difícil).

Nós temos a sorte de estarmos entre as línguas mais faladas do mundo. Em geral, os softwares de tradução são melhores para as línguas com maior número de pessoas, já que alguns deles dependem do feedback de tradução.

Um teste simples é solicitar uma tradução e retornar o texto para a língua original. Por exemplo, coloquei a primeira frase desta postagem no Translate e solicitei a tradução para o inglês. Depois, colei o resultado e solicitei uma nova tradução para o português. O resultado foi:  A popularização de programas que permitem a tradução de um texto, como o Tradutor, mudou substancialmente nossas vidas. Compare o resultado com a primeira frase e veja como o Translate traduziu o seu nome e mudou “tem alterado” para “mudou”, o que é um pouco diferente.

Mesmo assim, é inegável reconhecer o impacto do Translate. Uma pesquisa muito interessante mostrou isto. Dois pesquisadores usaram dados do eBay para mostrar isto. Quando a empresa colocou uma MT (machine translation inglês-espanhol, o número de transações dos Estados Unidos e América Latina aumentou substancialmente.

Mais interessante, identificamos os seguintes efeitos heterogêneos de tratamento: o aumento nas exportações é mais pronunciado para (1) produtos com mais palavras em títulos de listagem, (2) produtos diferenciados, (3) produtos baratos e (4) compradores menos experientes.

(O texto acima foi traduzido no Translate). O gráfico abaixo mostra as exportações no Ebay para América Latina e para outros países. A linha que corta o gráfico é o momento da entrada da tradução.

Pesquisa online é representativa

Nos dias atuais é muito comum as pesquisas acadêmicas serem realizadas pela internet. A grande vantagem é a facilidade de aplicação dos instrumentos de pesquisa e o baixo custo. O grande problema é saber se os resultados podem ser inferidos para a população. Em especial, existe um universo de pessoas que não estão online e que não são alcançadas por estas pesquisas. Um pesquisa aponta que este problema é real:

A general concern with the representativeness of online surveys is that they exclude the “offline” population that does not use the internet. We run a large-scale opinion survey with (1) onliners in web mode, (2) offliners in face-to-face mode, and (3) onliners in faceto-face mode. We find marked response differences between onliners and offliners in the mixed-mode setting (1 vs. 2). Response differences between onliners and offliners in the same face-to-face mode (2 vs. 3) disappear when controlling for background characteristics, indicating mode effects rather than unobserved population differences. Differences in background characteristics of onliners in the two modes (1 vs. 3) indicate that mode effects partly reflect sampling differences. In our setting, re-weighting online-survey observations appears a pragmatic solution when aiming at representativeness for the entire population.

Observe que os pesquisadores apresentaram uma possível sugestão para resolver este problema de representatividade, através de uma ponderação.

GREWENIG, Elisabeth et al. Can Online Surveys Represent the Entire Population?, Set, 2018. Iza Papers

Pesquisando dados

Para quem faz pesquisa, o acesso a uma base de dados pode ser fundamental. Muitas pesquisas são construídas a partir de uma base de dados existentes. Na área contábil, esta base de dados deve incluir não somente os balanços e outras demonstrações, mas também preço das ações, fatos relevantes, entre outras informações. Para o pesquisador é fundamental o acesso a uma base de dados e muitas instituições de ensino assinam estas bases, como a Reuters ou Economática.

Um problema é que as bases de dados não são completas. Uma informação eu posso buscar no site do Banco Central, mas outra talvez seja mais fácil obter no Ipeadata.

Recentemente o Google lançou um projeto de ligar as bases de dados existentes na internet. O projeto procura facilitar a vida do cientista (do jornalista ou do curioso) em encontrar os dados necessários para sua pesquisa. Neste sentido, o facilitador de base de dados lembra o Google Acadêmico, que centraliza as publicações mais relevantes de pesquisa. O Dataset search pode realmente ser um facilitador.

O que o Google ganha com isto? Acesso a um grande conjunto de informações, sendo referência quando o interesse é coletar dados. Ao contrário do Wolfram, que pretende dar uma resposta a uma pergunta como qual o ativo da Petrobras, o Google indica base de dados onde é possível encontrar os dados.

Atualmente, o número de base de dados é pequena. Isto é um problema. Digitei a palavra "accounting" e apareceu onze respostas. Praticamente nenhuma das respostas seria de interesse de um pesquisador na nossa área. Em várias, os dados estão desatualizados. Por enquanto, o produto do Google é muito mais uma promessa que uma realidade. Mas quem sabe você encontra alguma coisa de seu interesse...

Rir é o melhor remédio

Tatuagem:





26 setembro 2018

Rice Paddy

Na plantação de arroz, no Japão, os agricultores fazem desenhos (rice paddy)



Aqui um vídeo

Impacto da informação

Uma forma de determinar a influência de uma nova informação é usar o mercado de capitais. Este método tem sido a base dos estudos de eventos. Outra maneira é trabalhar com experimentos. Alguns deles são realizados em situações reais. Um exemplo encontra-se em uma pesquisa para tentar determinar se a informação da quantidade de calorias pode influenciar as escolhas das pessoas em um restaurante. Trata-se de um experimento de campo. Usando dois restaurantes, os pesquisadores receberam menus típicos, mas para um grupo existia a contagem de caloria.

Estimamos que os rótulos resultaram em uma redução de 3,0% nas calorias encomendadas, com a redução ocorrendo em aperitivos e entradas, mas não bebidas ou sobremesas.

NBER

Recentemente os papers NBER completaram o texto 25 mil. Para quem deseja estar a par das últimas pesquisas na área econômica, entrar no site toda segunda é uma obrigação.

O NBER corresponde ao National Bureau of Economic Research. Em 1973 foi divulgado o primeiro artigo. O objetivo era que os pesquisadores associados pudessem dividir seus achados e obter feedback de seus pares, antes de uma publicação. A cada ano são divulgados mais de mil artigos, das mais diversas áreas da economia. Muitos deles depois serão publicados em periódicos de elevado impacto.

Não conheço algo similar no Brasil (talvez o Banco Central e o Ipea sejam similares, mas honestamente não sei se são abertos aos pesquisadores de fora destas instituições). Conheço outros similares ao NBER, em áreas específicas (como o IZA, sobre mercado de trabalho). Mas na similar e com esta abrangência na área contábil. É pena. 

(Lembro de uma pesquisa de mostrou que a ordem que um artigo aparecia na página tinha influencia no número de citações; ou seja, os primeiros artigos na listagem semanal eram mais citados. Era um claro indício que os pesquisadores consultavam a página)