Translate

Mostrando postagens com marcador Deepseek. Mostrar todas as postagens
Mostrando postagens com marcador Deepseek. Mostrar todas as postagens

30 janeiro 2025

Vantagens e Desvantagens do DeepSeek na ciência


Cientistas estão aderindo em massa ao DeepSeek-R1, um modelo de inteligência artificial (IA) voltado para "raciocínio", que é barato e poderoso, e que fez o mercado de ações dos EUA despencar após seu lançamento por uma empresa chinesa na semana passada.

Pesquisadores apontam algumas vantagens notáveis do DeepSeek:

  • O modelo é muito mais barato de usar do que concorrentes proprietários, como o o1 da OpenAI. Seu chatbot online, DeepThink, é gratuito.
  • Pesquisadores podem baixar o DeepSeek para seus próprios servidores, executá-lo e desenvolvê-lo gratuitamente, o que representa uma vantagem em termos de privacidade.
  • Em testes preliminares com tarefas científicas baseadas em dados, o DeepSeek apresentou desempenho equivalente ao o1.

No entanto, há também algumas desvantagens:

  • O modelo falha em algumas tarefas relativamente simples, que também costumam confundir outros grandes modelos de linguagem, como contar quantos estados dos EUA possuem a letra "W" no nome.
  • O DeepSeek-R1 parece incapaz, em certos momentos, de fornecer informações sobre temas considerados sensíveis pelo governo chinês, embora não esteja claro se isso é uma limitação embutida no modelo ou se decorre de restrições aplicadas à sua interface.
Esse é um resumo, mas o texto original está aqui

29 janeiro 2025

Hipocrisia ou desespero?


Como o Financial Times relata, a OpenAI está acusando o aplicativo [Deepseek] de usar seus modelos proprietários para treinar seu próprio concorrente ChatGPT. A empresa alegou que tinha “algumas evidências” de DeepSeek usando a saída dos modelos da OpenAI para treinar sua própria, uma técnica chamada “destilação”, que, segundo ela, pode ter violado seus termos de serviço.

O artigo chama isso de hipocrisia, já que a OpenAI provavelmente usou conteúdos criados por humanos, muitos deles com direitos autorais, que não foram remunerados (e nem consultados sobre o uso). 

28 janeiro 2025

DeepSeek Explicada

 A DeepSeek causou um impacto em Silicon Valley, Wall Street e na Casa Branca. O presidente Trump — que, há uma semana, elogiou uma aliança separada entre OpenAI, SoftBank e Oracle para financiar a iniciativa de inteligência artificial Stargate, de US$ 100 bilhões — chamou a fabricante chinesa de chatbots de "um alerta" para as grandes empresas de tecnologia.

Mas será mesmo? Cade Metz, do The Times, que respondeu a algumas perguntas urgentes sobre a DeepSeek, explicou ao DealBook por que a ascensão surpreendente da start-up é tão significativa.

Como a DeepSeek se compara à OpenAI e ao Google?

Ela é tão eficaz em responder perguntas, resolver problemas lógicos ou escrever códigos quanto qualquer outra solução no mercado. Mais impressionante, a empresa lançou um modelo avançado de "raciocínio" chamado DeepSeek-R1, que representa a próxima fase no desenvolvimento da IA.

Mesmo o mais recente modelo de raciocínio da OpenAI, o OpenAI o3, ainda não foi disponibilizado ao público.

Isso significa que a China está agora à frente dos Estados Unidos na corrida pela supremacia em IA?

Ainda não. O mundo ainda não viu o modelo o3 da OpenAI, e seu desempenho em testes de referência padrão é mais impressionante do que qualquer outra coisa no mercado.

Por que a IA de código aberto é importante?

A DeepSeek compartilhou seu código-fonte com outras empresas e pesquisadores, permitindo que outros criem e distribuam seus próprios produtos. Essa abordagem permite testar e melhorar o código, o que, em parte, explica como a DeepSeek e outras empresas na China conseguiram desenvolver sistemas de IA competitivos tão rapidamente e a um custo tão baixo. Quando a Meta compartilhou um sistema de IA de forma gratuita em 2023, alguns consideraram isso perigoso, pois agentes mal-intencionados poderiam usá-lo. A DeepSeek ajudou a mostrar que esse sistema pode criar vencedores.


Yann LeCun, cientista-chefe de IA da Meta, disse que a queda no mercado de ações interpreta de forma errada o caso de investimento na tecnologia, especialmente em chips de ponta. O que ele quis dizer?

Os chips são necessários em duas etapas: no treinamento (ou desenvolvimento) da IA e na execução da IA. A execução acontece quando você e eu usamos o serviço — o que é chamado de "inferência".

Yann está afirmando que muitos chips ainda são necessários para executar produtos de IA.

Alguns acreditam que a DeepSeek está usando mais chips da Nvidia do que declarou e que os custos são muito maiores. Podemos confiar no que foi dito?

A DeepSeek detalhou em um artigo de pesquisa como conseguiu usar de forma mais eficiente um pequeno número de chips. Qualquer outra pessoa pode replicar o que eles fizeram. A DeepSeek pode ter acesso a mais chips da Nvidia e certamente teve custos além dos cerca de US$ 6 milhões que disse ter gasto para treinar seus novos sistemas. No entanto, os ganhos de eficiência são reais.

do NYTimes, DealBook, 28/1/2025