Negócio da China: O que é DeepSeek e por que ele está revolucionando o setor de IA?

Foto: Divulgação / Reuters. 
O lançamento dos mais recentes modelos de IA da startup chinesa DeepSeek, que segundo a empresa estão no mesmo nível ou são melhores do que os modelos líderes do setor nos Estados Unidos por uma fração do custo, ameaça perturbar a ordem mundial da tecnologia.

A empresa atraiu a atenção nos círculos globais de IA depois de escrever em um artigo no mês passado que o treinamento do DeepSeek-V3 exigiu menos de US$ 6 milhões em poder de computação dos chips Nvidia H800.

O assistente de IA do DeepSeek, equipado com o DeepSeek-V3, ultrapassou o rival ChatGPT e se tornou o aplicativo gratuito mais bem avaliado disponível na App Store da Apple nos Estados Unidos.

Isso levantou dúvidas sobre o raciocínio por trás da decisão de algumas empresas de tecnologia dos EUA de prometer bilhões de dólares em investimentos em IA, e as ações de várias grandes empresas de tecnologia, incluindo a Nvidia, foram afetadas.

Abaixo estão alguns fatos sobre a empresa que está sacudindo o setor de IA no mundo todo.

POR QUE O DEEPSEEK ESTÁ CAUSANDO ALVOROÇO?

O lançamento do ChatGPT da OpenAI no final de 2022 causou uma confusão entre as empresas de tecnologia chinesas , que se apressaram para criar seus próprios chatbots movidos por inteligência artificial.

Mas após o lançamento do primeiro equivalente chinês do ChatGPT, feito pelo gigante dos mecanismos de busca Baidu (9888.HK), abre uma nova aba, houve decepção generalizada na China com a lacuna nas capacidades de IA entre empresas americanas e chinesas.

A qualidade e a eficiência de custo dos modelos da DeepSeek viraram essa narrativa de cabeça para baixo. Os dois modelos que foram elogiados por executivos do Vale do Silício e engenheiros de empresas de tecnologia dos EUA, DeepSeek-V3 e DeepSeek-R1, estão no mesmo nível dos modelos mais avançados da OpenAI e da Meta, disse a startup chinesa.

Eles também são mais baratos de usar. O DeepSeek-R1, lançado na semana passada, é de 20 a 50 vezes mais barato de usar do que o modelo OpenAI o1, dependendo da tarefa, de acordo com uma publicação na conta oficial do DeepSeek no WeChat.

Mas alguns expressaram publicamente ceticismo sobre a história de sucesso do DeepSeek.

O CEO da Scale AI, Alexandr Wang, disse durante uma entrevista à CNBC na quinta-feira, sem fornecer evidências, que a DeepSeek tem 50.000 chips Nvidia H100, que ele alegou que não seriam divulgados porque isso violaria os controles de exportação de Washington que proíbem que tais chips avançados de IA sejam vendidos para empresas chinesas. A DeepSeek não respondeu imediatamente a um pedido de comentário sobre a alegação.

Analistas da Bernstein destacaram na segunda-feira em uma nota de pesquisa que os custos totais de treinamento da DeepSeek para seu modelo V3 eram desconhecidos, mas eram muito maiores do que os US$ 5,58 milhões que a startup disse terem sido usados ​​para poder de computação. Os analistas também disseram que os custos de treinamento do igualmente aclamado modelo R1 não foram divulgados.

QUEM ESTÁ POR TRÁS DO DEEPSEEK?

A DeepSeek é uma startup sediada em Hangzhou cujo acionista controlador é Liang Wenfeng, cofundador do fundo de hedge quantitativo High-Flyer, com base em registros corporativos chineses.

O fundo de Liang anunciou em março de 2023 em sua conta oficial do WeChat que estava "começando de novo", indo além da negociação para concentrar recursos na criação de um "novo e independente grupo de pesquisa, para explorar a essência da AGI" (Inteligência Geral Artificial). O DeepSeek foi criado mais tarde naquele ano.

Os criadores do ChatGPT, OpenAI, definem a AGI como sistemas autônomos que superam os humanos na maioria das tarefas economicamente valiosas.

Não está claro quanto a High-Flyer investiu na DeepSeek. A High-Flyer tem um escritório localizado no mesmo prédio da DeepSeek e também possui patentes relacionadas a clusters de chips usados ​​para treinar modelos de IA, de acordo com registros corporativos chineses.

A unidade de IA da High-Flyer disse em sua conta oficial do WeChat em julho de 2022 que possui e opera um cluster de 10.000 chips A100.

COMO PEQUIM VÊ O DEEPSEEK?

O sucesso do DeepSeek já foi notado nos principais círculos políticos da China. Em 20 de janeiro, o dia em que o DeepSeek-R1 foi lançado ao público, o fundador Liang compareceu a um simpósio a portas fechadas para empresários e especialistas, organizado pelo premiê chinês Li Qiang, de acordo com a agência de notícias estatal Xinhua.

A presença de Liang no encontro é potencialmente um sinal de que o sucesso do DeepSeek pode ser importante para a meta política de Pequim de superar os controles de exportação de Washington e alcançar autossuficiência em setores estratégicos como IA.

Um simpósio semelhante no ano passado contou com a presença do CEO da Baidu, Robin Li.

Reportagem de Eduardo Baptista. Edição de Jane Merriman (*) @reuters

Post a Comment

Postagem Anterior Próxima Postagem