Nemotron 3 Ultra: Nvidia lança modelo aberto de IA com 550 bi de parâmetros, mas China ainda lidera
2 de junho de 2026
Nvidia apresenta o Nemotron 3 Ultra, modelo open-weight de 550 bilhões de parâmetros que se torna o melhor dos EUA, mas ainda perde para os concorrentes chineses em benchmarks de raciocínio. Fonte: De...
A Nvidia apresentou o Nemotron 3 Ultra, um modelo de linguagem de 550 bilhões de parâmetros que se torna o melhor modelo de peso aberto (open-weight) dos Estados Unidos. Apesar do avanço técnico, o sistema ainda perde para modelos chineses de ponta, como o Qwen e o DeepSeek, destacando a liderança da China no segmento de IA aberta. O anúncio foi feito no Decrypt e reforça a corrida global por modelos cada vez mais potentes e acessíveis.
O que é o Nemotron 3 Ultra e por que esse modelo importa?
O Nemotron 3 Ultra é um modelo de linguagem de 550 bilhões de parâmetros desenvolvido pela Nvidia com arquitetura de mistura de especialistas (MoE). Ele foi disponibilizado com pesos abertos, permitindo que desenvolvedores e empresas o baixem, adaptem e executem em seus próprios servidores — sem depender de APIs externas. Em testes internos da Nvidia, o modelo superou o Llama 3.1 405B da Meta e o Mistral Large 2, tornando-se o líder entre os modelos open-weight dos EUA.
No entanto, benchmarks independentes mostram que o Nemotron 3 Ultra ainda fica atrás de modelos chineses como o Qwen 2.5 72B e o DeepSeek-V3 em tarefas de raciocínio matemático, compreensão contextual e eficiência computacional. A vantagem chinesa não está apenas no tamanho, mas na otimização: os modelos do país asiático conseguem desempenho similar com menos parâmetros.
Nemotron 3 Ultra vs modelos chineses: quem lidera?
Em termos de parâmetros, o Nemotron 3 Ultra é maior que a maioria dos concorrentes, mas o desempenho não escala linearmente. Nos testes MMLU (raciocínio geral), GSM8K (matemática) e HumanEval (código), o Qwen 2.5 72B obteve respectivamente 86,4%, 94,9% e 85,8% de acerto, enquanto o Nemotron 3 Ultra registrou 85,1%, 92,3% e 83,5%. A diferença é pequena, mas consistente.
Além disso, o modelo chinês DeepSeek-V3, com 671 bilhões de parâmetros, alcançou desempenho superior em eficiência energética e latência, usando técnicas de especialização mais refinadas. Isso indica que a liderança chinesa não é apenas bruta, mas estratégica: eles combinam escala com arquiteturas mais enxutas.
Por que o Nemotron 3 Ultra importa para desenvolvedores brasileiros?
Para a comunidade brasileira de IA, a disputa entre EUA e China abre oportunidades. Modelos open-weight como o Nemotron 3 Ultra podem ser adaptados ao português sem depender de gigantes estrangeiros. Além disso, a concorrência pressiona os preços de inferência e acelera a inovação. Empresas brasileiras que constroem soluções de IA para agronegócio, saúde ou finanças podem testar o Nemotron 3 Ultra em suas próprias GPUs Nvidia, aproveitando a integração nativa com o ecossistema CUDA.
Por outro lado, modelos chineses como o Qwen já oferecem suporte multilíngue e podem ser executados em hardware mais modesto. Para startups com orçamento limitado, os modelos chineses frequentemente entregam mais custo-benefício. Contudo, questões de privacidade e regulamentação — como a Lei Geral de Proteção de Dados (LGPD) — podem favorecer soluções americanas ou europeias.
Futuro da IA aberta: corrida entre EUA e China
A Nvidia, maior fabricante de chips de IA do mundo, tem interesse direto em que modelos abertos sejam executados em seu hardware — cada Nemotron 3 Ultra rodando em GPUs A100 ou H100 gera receita recorrente. Por isso, a empresa investe pesado em pesquisa de modelos, mesmo que não os comercialize diretamente. O anúncio do Nemotron 3 Ultra coincide com a expectativa para o GTC 2026: NVIDIA revela chips de IA de próxima geração e plataforma para robótica, onde a Nvidia deve revelar chips de IA de próxima geração que prometem acelerar ainda mais o treinamento de modelos massivos.
Enquanto isso, a China avança com investimentos estatais e privados. O governo chinês subsidia pesquisa em IA aberta como parte de seu plano de soberania tecnológica. Modelos como o DeepSeek-V3 e o Qwen 2.5 são desenvolvidos com apoio de universidades e big techs locais, como Alibaba e Baidu, e frequentemente superam rivais ocidentais em benchmarks abertos. Se a tendência continuar, os EUA podem perder a liderança também no segmento de modelos abertos, que hoje é dominado pela Meta e agora pela Nvidia.
Perguntas frequentes sobre o Nemotron 3 Ultra
O Nemotron 3 Ultra é gratuito?
Sim, os pesos do modelo foram disponibilizados gratuitamente pela Nvidia, mas é necessário ter infraestrutura própria (GPUs) para executá-lo, o que pode gerar custos de hardware e energia.Quais são as principais diferenças entre o Nemotron 3 Ultra e o modelo chinês Qwen?
O Nemotron 3 Ultra tem mais parâmetros (550 bi vs. 72 bi), mas o Qwen é mais eficiente e supera em benchmarks de raciocínio e código, além de exigir menos recursos computacionais para inferência.Como testar o Nemotron 3 Ultra?
Os pesos estão disponíveis no Hugging Face e em repositórios oficiais da Nvidia. É necessário ter pelo menos uma GPU com 80 GB de VRAM para rodar o modelo completo, ou usar versões quantizadas.Leia mais sobre o evento GTC 2026: NVIDIA revela chips de IA de próxima geração e plataforma para robótica e a trajetória da empresa no setor. Fonte: Decrypt.
Fonte: decrypt.co
Escrito por
Lucas MontarroiosSou Lucas Montarroios e dediquei os últimos 15 anos à linha de frente de operações de telecom e data centers. Minha carreira sempre foi pautada por um foco implacável: transformar tecnologia e cenários críticos em oportunidades reais de negócio. No novidades.ia.br, trago essa visão executiva para o universo da IA. Especialista em produtos, mercado e ferramentas práticas de IA. Minha missão aqui é filtrar o ruído do mercado, analisando benchmarks, estratégias de grandes empresas e ferramentas práticas para o seu dia a dia.