4 startups chinesas de IA para ficar de olho além da DeepSeek

Uma imagem mostrando a tela de um smartphone com o aplicativo da startup "DeepSeek" aberto. Na tela, é exibida a mensagem: "Hi, I'm DeepSeek. How can I help you today?" com o logotipo do aplicativo, que representa um golfinho estilizado em azul. Ao fundo, desfocado, está o logotipo maior do "DeepSeek" junto com o texto "Into the unknown".

O crescimento meteórico da DeepSeek — startup chinesa de IA que desafia gigantes globais — surpreendeu o mercado e colocou os holofotes sobre o setor de inteligência artificial na China. Desde a estreia do ChatGPT em 2022, o ecossistema tecnológico chinês tem buscado incansavelmente alternativas locais, impulsionando uma onda de startups e apostas bilionárias.

Hoje, essa corrida é dominada por gigantes como Alibaba e ByteDance, além de concorrentes bem financiados com apoio de investidores de peso. Mas, dois anos após o boom da IA generativa na China, o cenário está mudando: startups menores precisam encontrar nichos próprios ou correm o risco de serem abandonadas. O que começou como um sprint se transformou em uma maratona de alto risco, com a ambição chinesa em IA atingindo novos patamares.

Um seleto grupo de empresas, conhecidas como as “Seis Tigresas” — Stepfun, Zhipu, Minimax, Moonshot, 01.AI e Baichuan — é geralmente considerado a vanguarda do setor de IA na China. Entretanto, empresas voltadas à pesquisa, como DeepSeek e ModelBest, continuam a ganhar influência. Algumas, como Minimax e Moonshot, estão renunciando ao caro treinamento de modelos fundacionais para focar em aplicações voltadas ao consumidor. Outras, como Stepfun e Infinigence AI, estão dobrando seus investimentos em pesquisa, impulsionadas pelas restrições dos EUA aos semicondutores.

Leia também: Trump e DeepSeek estão em foco enquanto nações se reúnem na Cúpula de IA em Paris

Abaixo, o MIT Technology Review destaca quatro startups chinesas de IA que merecem atenção.

  1. Stepfun

Fundada em abril de 2023 por Jiang Daxin, ex-vice-presidente sênior da Microsoft, a Stepfun entrou relativamente tarde no cenário de startups de IA, mas rapidamente se tornou um concorrente forte com seu portfólio de modelos fundacionais. A empresa segue firme no objetivo de desenvolver inteligência artificial geral (AGI), uma meta que muitas startups chinesas já abandonaram.

Com financiamento de investidores como Tencent e apoio do governo de Xangai, a Stepfun lançou 11 modelos fundacionais de IA no ano passado, abrangendo linguagem, visão, vídeo, áudio e sistemas multimodais. Seu maior modelo de linguagem, o Step-2, tem mais de 1 trilhão de parâmetros (o GPT-4 tem cerca de 1,8 trilhão). Ele está atualmente entre os melhores no LiveBench, uma plataforma que avalia modelos de IA de grande escala, ficando atrás apenas do ChatGPT, DeepSeek, Claude e Gemini.

Além disso, seu modelo multimodal, Step-1V, é altamente classificado por sua capacidade de entender entradas visuais no Chatbot Arena, plataforma onde usuários comparam e classificam modelos de IA.

Agora, a Stepfun está trabalhando com desenvolvedores de aplicativos de IA que usam seus modelos. Segundo o site chinês 36Kr, a demanda por sua API multimodal cresceu mais de 45 vezes na segunda metade de 2024.

  1. ModelBest

Fundada em 2022 por pesquisadores da Universidade Tsinghua, a ModelBest se destacou ao focar em eficiência e adotar a tendência dos pequenos modelos de linguagem. Sua série MiniCPM, apelidada de “Pequenos Poderosos” na China, é projetada para processamento local e em tempo real em smartphones, PCs, automóveis, dispositivos inteligentes e até robôs. O diferencial da empresa é que seus modelos compactos garantem menor custo e maior privacidade para os usuários.

Seu modelo mais recente, o MiniCPM 3.0, tem apenas 4 bilhões de parâmetros, mas iguala o GPT-3.5 em vários benchmarks. Os modelos da empresa podem ser encontrados no GitHub e Hugging Face sob o perfil OpenBMB (Open Lab for Big Model Base), seu laboratório de pesquisa open-source.

Os investidores estão atentos: em dezembro de 2024, a ModelBest anunciou sua terceira rodada de financiamento, arrecadando dezenas de milhões de dólares.

  1. Zhipu

Também originária da Universidade Tsinghua, a Zhipu AI cresceu com fortes laços com o governo e o meio acadêmico. A empresa desenvolve tanto modelos fundacionais quanto produtos de IA baseados neles, como o ChatGLM (modelo conversacional) e o gerador de vídeos Ying, semelhante ao Sora, da OpenAI.

Seu modelo de linguagem mais avançado, o GLM-4-Plus, é treinado com dados sintéticos de alta qualidade, reduzindo custos de treinamento, mas ainda assim rivaliza com o GPT-4. Além disso, a empresa lançou o GLM-4V-Plus, um modelo de visão capaz de interpretar páginas da web e vídeos, dando um passo em direção a IAs mais autônomas.

Entre as novas startups chinesas de IA, a Zhipu foi a primeira a entrar no radar do governo dos EUA. Em 15 de janeiro de 2025, a administração Biden incluiu a Zhipu e outras 20 entidades chinesas na lista de restrições comerciais, alegando que sua tecnologia beneficia o setor militar chinês — o que a empresa nega.

Avaliada em mais de US$ 2 bilhões, a Zhipu é uma das maiores startups de IA da China e está se preparando para abrir capital em breve. Seus investidores incluem fundos ligados ao governo de Pequim e grandes fundos de capital de risco.

  1. Infinigence AI

Fundada em 2023, a Infinigence AI é menor do que as outras empresas desta lista, mas já atraiu mais de US$ 140 milhões em financiamento. Em vez de desenvolver modelos de IA, a empresa se concentra em infraestrutura, com uma tecnologia que permite combinar chips de diferentes fabricantes para realizar tarefas de IA. Isso é crucial para startups chinesas que enfrentam restrições dos EUA ao acesso a chips avançados.

A startup afirma que sua tecnologia pode aumentar a eficiência do treinamento de IA ao coordenar diferentes arquiteturas de chips — incluindo modelos da AMD, Huawei e Nvidia — em sincronia.

Além disso, a Infinigence AI lançou a Infini-AI Cloud, uma plataforma que permite desenvolver e implantar modelos de IA usando produtos de múltiplos fornecedores. Segundo a empresa, seu sistema de treinamento, HetHub, pode reduzir em 30% o tempo de treinamento de modelos de IA ao otimizar a infraestrutura computacional chinesa.

Siga o IT Forum no LinkedIn e fique por dentro de todas as notícias!