A DeepSeek causou um impacto em Silicon Valley, Wall Street e na Casa Branca. O presidente Trump — que, há uma semana, elogiou uma aliança separada entre OpenAI, SoftBank e Oracle para financiar a iniciativa de inteligência artificial Stargate, de US$ 100 bilhões — chamou a fabricante chinesa de chatbots de "um alerta" para as grandes empresas de tecnologia.
Mas será mesmo? Cade Metz, do The Times, que respondeu a algumas perguntas urgentes sobre a DeepSeek, explicou ao DealBook por que a ascensão surpreendente da start-up é tão significativa.
Como a DeepSeek se compara à OpenAI e ao Google?
Ela é tão eficaz em responder perguntas, resolver problemas lógicos ou escrever códigos quanto qualquer outra solução no mercado. Mais impressionante, a empresa lançou um modelo avançado de "raciocínio" chamado DeepSeek-R1, que representa a próxima fase no desenvolvimento da IA.
Mesmo o mais recente modelo de raciocínio da OpenAI, o OpenAI o3, ainda não foi disponibilizado ao público.
Isso significa que a China está agora à frente dos Estados Unidos na corrida pela supremacia em IA?
Ainda não. O mundo ainda não viu o modelo o3 da OpenAI, e seu desempenho em testes de referência padrão é mais impressionante do que qualquer outra coisa no mercado.
Por que a IA de código aberto é importante?
A DeepSeek compartilhou seu código-fonte com outras empresas e pesquisadores, permitindo que outros criem e distribuam seus próprios produtos. Essa abordagem permite testar e melhorar o código, o que, em parte, explica como a DeepSeek e outras empresas na China conseguiram desenvolver sistemas de IA competitivos tão rapidamente e a um custo tão baixo. Quando a Meta compartilhou um sistema de IA de forma gratuita em 2023, alguns consideraram isso perigoso, pois agentes mal-intencionados poderiam usá-lo. A DeepSeek ajudou a mostrar que esse sistema pode criar vencedores.
Yann LeCun, cientista-chefe de IA da Meta, disse que a queda no mercado de ações interpreta de forma errada o caso de investimento na tecnologia, especialmente em chips de ponta. O que ele quis dizer?
Os chips são necessários em duas etapas: no treinamento (ou desenvolvimento) da IA e na execução da IA. A execução acontece quando você e eu usamos o serviço — o que é chamado de "inferência".
Yann está afirmando que muitos chips ainda são necessários para executar produtos de IA.
Alguns acreditam que a DeepSeek está usando mais chips da Nvidia do que declarou e que os custos são muito maiores. Podemos confiar no que foi dito?
A DeepSeek detalhou em um artigo de pesquisa como conseguiu usar de forma mais eficiente um pequeno número de chips. Qualquer outra pessoa pode replicar o que eles fizeram. A DeepSeek pode ter acesso a mais chips da Nvidia e certamente teve custos além dos cerca de US$ 6 milhões que disse ter gasto para treinar seus novos sistemas. No entanto, os ganhos de eficiência são reais.
do NYTimes, DealBook, 28/1/2025
Nenhum comentário:
Postar um comentário