Translate

28 janeiro 2025

DeepSeek Explicada

 A DeepSeek causou um impacto em Silicon Valley, Wall Street e na Casa Branca. O presidente Trump — que, há uma semana, elogiou uma aliança separada entre OpenAI, SoftBank e Oracle para financiar a iniciativa de inteligência artificial Stargate, de US$ 100 bilhões — chamou a fabricante chinesa de chatbots de "um alerta" para as grandes empresas de tecnologia.

Mas será mesmo? Cade Metz, do The Times, que respondeu a algumas perguntas urgentes sobre a DeepSeek, explicou ao DealBook por que a ascensão surpreendente da start-up é tão significativa.

Como a DeepSeek se compara à OpenAI e ao Google?

Ela é tão eficaz em responder perguntas, resolver problemas lógicos ou escrever códigos quanto qualquer outra solução no mercado. Mais impressionante, a empresa lançou um modelo avançado de "raciocínio" chamado DeepSeek-R1, que representa a próxima fase no desenvolvimento da IA.

Mesmo o mais recente modelo de raciocínio da OpenAI, o OpenAI o3, ainda não foi disponibilizado ao público.

Isso significa que a China está agora à frente dos Estados Unidos na corrida pela supremacia em IA?

Ainda não. O mundo ainda não viu o modelo o3 da OpenAI, e seu desempenho em testes de referência padrão é mais impressionante do que qualquer outra coisa no mercado.

Por que a IA de código aberto é importante?

A DeepSeek compartilhou seu código-fonte com outras empresas e pesquisadores, permitindo que outros criem e distribuam seus próprios produtos. Essa abordagem permite testar e melhorar o código, o que, em parte, explica como a DeepSeek e outras empresas na China conseguiram desenvolver sistemas de IA competitivos tão rapidamente e a um custo tão baixo. Quando a Meta compartilhou um sistema de IA de forma gratuita em 2023, alguns consideraram isso perigoso, pois agentes mal-intencionados poderiam usá-lo. A DeepSeek ajudou a mostrar que esse sistema pode criar vencedores.


Yann LeCun, cientista-chefe de IA da Meta, disse que a queda no mercado de ações interpreta de forma errada o caso de investimento na tecnologia, especialmente em chips de ponta. O que ele quis dizer?

Os chips são necessários em duas etapas: no treinamento (ou desenvolvimento) da IA e na execução da IA. A execução acontece quando você e eu usamos o serviço — o que é chamado de "inferência".

Yann está afirmando que muitos chips ainda são necessários para executar produtos de IA.

Alguns acreditam que a DeepSeek está usando mais chips da Nvidia do que declarou e que os custos são muito maiores. Podemos confiar no que foi dito?

A DeepSeek detalhou em um artigo de pesquisa como conseguiu usar de forma mais eficiente um pequeno número de chips. Qualquer outra pessoa pode replicar o que eles fizeram. A DeepSeek pode ter acesso a mais chips da Nvidia e certamente teve custos além dos cerca de US$ 6 milhões que disse ter gasto para treinar seus novos sistemas. No entanto, os ganhos de eficiência são reais.

do NYTimes, DealBook, 28/1/2025

Nenhum comentário:

Postar um comentário