Como o Nemotron 3 Ultra se compara à concorrência chinesa?

Em benchmarks, ainda perde para modelos como o Qwen e o DeepSeek, que lideram em várias tarefas de raciocínio e linguagem.

O modelo é realmente aberto?

Sim, os pesos são abertos para a comunidade, mas a Nvidia impõe restrições de uso e não libera o código de treinamento completo.

Quem pode usar o Nemotron 3 Ultra no Brasil?

Desenvolvedores e pesquisadores brasileiros podem baixar, adaptar e aplicar o modelo, desde que cumpram os termos de licença.

Qual o impacto do Nemotron 3 Ultra no mercado de IA?

Ele fortalece a posição dos EUA na corrida global, mas a China ainda lidera em modelos abertos, indicando uma competição acirrada.

Open Source LLM

Nemotron 3 Ultra: Nvidia lança modelo aberto de IA com 550 bi de parâmetros, mas China ainda lidera

Q: O que é o Nemotron 3 Ultra?

É um modelo de inteligência artificial open-weight da Nvidia, com 550 bilhões de parâmetros, disponível para pesquisa e uso comercial.

Lucas Montarroios

2 de junho de 2026

Nvidia apresenta o Nemotron 3 Ultra, modelo open-weight de 550 bilhões de parâmetros que se torna o melhor dos EUA, mas ainda perde para os concorrentes chineses em benchmarks de raciocínio. Fonte: De...

Carregando áudio…

Nemotron 3 Ultra: Nvidia lança modelo aberto de IA com 550 bi de parâmetros, mas China ainda lidera

A Nvidia apresentou o Nemotron 3 Ultra, um modelo de linguagem de 550 bilhões de parâmetros que se torna o melhor modelo de peso aberto (open-weight) dos Estados Unidos. Apesar do avanço técnico, o sistema ainda perde para modelos chineses de ponta, como o Qwen e o DeepSeek, destacando a liderança da China no segmento de IA aberta. O anúncio foi feito no Decrypt e reforça a corrida global por modelos cada vez mais potentes e acessíveis.

O que é o Nemotron 3 Ultra e por que esse modelo importa?

O Nemotron 3 Ultra é um modelo de linguagem de 550 bilhões de parâmetros desenvolvido pela Nvidia com arquitetura de mistura de especialistas (MoE). Ele foi disponibilizado com pesos abertos, permitindo que desenvolvedores e empresas o baixem, adaptem e executem em seus próprios servidores — sem depender de APIs externas. Em testes internos da Nvidia, o modelo superou o Llama 3.1 405B da Meta e o Mistral Large 2, tornando-se o líder entre os modelos open-weight dos EUA.

No entanto, benchmarks independentes mostram que o Nemotron 3 Ultra ainda fica atrás de modelos chineses como o Qwen 2.5 72B e o DeepSeek-V3 em tarefas de raciocínio matemático, compreensão contextual e eficiência computacional. A vantagem chinesa não está apenas no tamanho, mas na otimização: os modelos do país asiático conseguem desempenho similar com menos parâmetros.

Nemotron 3 Ultra vs modelos chineses: quem lidera?

Em termos de parâmetros, o Nemotron 3 Ultra é maior que a maioria dos concorrentes, mas o desempenho não escala linearmente. Nos testes MMLU (raciocínio geral), GSM8K (matemática) e HumanEval (código), o Qwen 2.5 72B obteve respectivamente 86,4%, 94,9% e 85,8% de acerto, enquanto o Nemotron 3 Ultra registrou 85,1%, 92,3% e 83,5%. A diferença é pequena, mas consistente.

Além disso, o modelo chinês DeepSeek-V3, com 671 bilhões de parâmetros, alcançou desempenho superior em eficiência energética e latência, usando técnicas de especialização mais refinadas. Isso indica que a liderança chinesa não é apenas bruta, mas estratégica: eles combinam escala com arquiteturas mais enxutas.

Por que o Nemotron 3 Ultra importa para desenvolvedores brasileiros?

Para a comunidade brasileira de IA, a disputa entre EUA e China abre oportunidades. Modelos open-weight como o Nemotron 3 Ultra podem ser adaptados ao português sem depender de gigantes estrangeiros. Além disso, a concorrência pressiona os preços de inferência e acelera a inovação. Empresas brasileiras que constroem soluções de IA para agronegócio, saúde ou finanças podem testar o Nemotron 3 Ultra em suas próprias GPUs Nvidia, aproveitando a integração nativa com o ecossistema CUDA.

Por outro lado, modelos chineses como o Qwen já oferecem suporte multilíngue e podem ser executados em hardware mais modesto. Para startups com orçamento limitado, os modelos chineses frequentemente entregam mais custo-benefício. Contudo, questões de privacidade e regulamentação — como a Lei Geral de Proteção de Dados (LGPD) — podem favorecer soluções americanas ou europeias.

Futuro da IA aberta: corrida entre EUA e China

A Nvidia, maior fabricante de chips de IA do mundo, tem interesse direto em que modelos abertos sejam executados em seu hardware — cada Nemotron 3 Ultra rodando em GPUs A100 ou H100 gera receita recorrente. Por isso, a empresa investe pesado em pesquisa de modelos, mesmo que não os comercialize diretamente. O anúncio do Nemotron 3 Ultra coincide com a expectativa para o GTC 2026: NVIDIA revela chips de IA de próxima geração e plataforma para robótica, onde a Nvidia deve revelar chips de IA de próxima geração que prometem acelerar ainda mais o treinamento de modelos massivos.

Enquanto isso, a China avança com investimentos estatais e privados. O governo chinês subsidia pesquisa em IA aberta como parte de seu plano de soberania tecnológica. Modelos como o DeepSeek-V3 e o Qwen 2.5 são desenvolvidos com apoio de universidades e big techs locais, como Alibaba e Baidu, e frequentemente superam rivais ocidentais em benchmarks abertos. Se a tendência continuar, os EUA podem perder a liderança também no segmento de modelos abertos, que hoje é dominado pela Meta e agora pela Nvidia.

Perguntas frequentes sobre o Nemotron 3 Ultra

O Nemotron 3 Ultra é gratuito?

Sim, os pesos do modelo foram disponibilizados gratuitamente pela Nvidia, mas é necessário ter infraestrutura própria (GPUs) para executá-lo, o que pode gerar custos de hardware e energia.

Quais são as principais diferenças entre o Nemotron 3 Ultra e o modelo chinês Qwen?

O Nemotron 3 Ultra tem mais parâmetros (550 bi vs. 72 bi), mas o Qwen é mais eficiente e supera em benchmarks de raciocínio e código, além de exigir menos recursos computacionais para inferência.

Como testar o Nemotron 3 Ultra?

Os pesos estão disponíveis no Hugging Face e em repositórios oficiais da Nvidia. É necessário ter pelo menos uma GPU com 80 GB de VRAM para rodar o modelo completo, ou usar versões quantizadas.

Leia mais sobre o evento GTC 2026: NVIDIA revela chips de IA de próxima geração e plataforma para robótica e a trajetória da empresa no setor. Fonte: Decrypt.

Fonte: decrypt.co

Escrito por

Lucas Montarroios

Sou Lucas Montarroios e dediquei os últimos 15 anos à linha de frente de operações de telecom e data centers. Minha carreira sempre foi pautada por um foco implacável: transformar tecnologia e cenários críticos em oportunidades reais de negócio. No novidades.ia.br, trago essa visão executiva para o universo da IA. Especialista em produtos, mercado e ferramentas práticas de IA. Minha missão aqui é filtrar o ruído do mercado, analisando benchmarks, estratégias de grandes empresas e ferramentas práticas para o seu dia a dia.

Nemotron 3 Ultra: Nvidia lança modelo aberto de IA com 550 bi de parâmetros, mas China ainda lidera

O que é o Nemotron 3 Ultra e por que esse modelo importa?

Nemotron 3 Ultra vs modelos chineses: quem lidera?

Por que o Nemotron 3 Ultra importa para desenvolvedores brasileiros?

Futuro da IA aberta: corrida entre EUA e China

Perguntas frequentes sobre o Nemotron 3 Ultra

O Nemotron 3 Ultra é gratuito?

Quais são as principais diferenças entre o Nemotron 3 Ultra e o modelo chinês Qwen?

Como testar o Nemotron 3 Ultra?

Artigos relacionados

Kimi K3: modelo chinês de 3 trilhões de parâmetros rivaliza com Claude e ChatGPT e será open-weight

Hugging Face sofre invasão por agente de IA autônomo: como a empresa usou IA para se defender

Mira Murati lança primeiro modelo de IA aberto da Thinking Machines Lab: Inkling promete revolucionar processamento multimodal