Nous Research lança NousCoder-14B: Modelo de Codificação Open-Source Desafia Gigantes Proprietários

Estados Unidos - Agência de Notícias Ekhbary

Nous Research lança NousCoder-14B: Modelo de Codificação Open-Source Desafia Gigantes Proprietários

Em um movimento que sublinha a rápida evolução do desenvolvimento de software assistido por IA, a Nous Research, uma startup de inteligência artificial open-source apoiada pela empresa de capital de risco de criptomoedas Paradigm, lançou um novo modelo de programação competitiva. O modelo, denominado NousCoder-14B, supostamente iguala ou supera vários sistemas proprietários maiores e foi treinado em um tempo impressionante de quatro dias, utilizando 48 das mais recentes unidades de processamento gráfico B200 da Nvidia.

O NousCoder-14B entra em um campo de assistentes de codificação de IA em rápida expansão, chegando em um momento particularmente oportuno. A ferramenta de programação agentica Claude Code da rival Anthropic tem dominado as discussões nas redes sociais desde o Dia de Ano Novo, com desenvolvedores compartilhando depoimentos entusiasmados sobre suas capacidades. Esses desenvolvimentos simultâneos destacam o ritmo acelerado do desenvolvimento de software impulsionado por IA e a feroz competição entre empresas, grandes e pequenas, para capturar o que muitos consideram uma tecnologia fundamental para a criação de software.

Leia também

No LiveCodeBench v6, uma avaliação padronizada de problemas de programação competitiva publicados entre agosto de 2024 e maio de 2025, o NousCoder-14B alcançou uma taxa de precisão de 67,87%. De acordo com o relatório técnico da Nous Research, este número representa uma melhoria significativa de 7,08 pontos percentuais em relação ao seu modelo base, o Qwen3-14B da Alibaba.

O sentimento atual em torno das ferramentas de codificação de IA foi vividamente capturado por Jaana Dogan, engenheira principal do Google responsável pela API Gemini. Em uma postagem viral no X na semana passada, Dogan compartilhou sua experiência: "Eu dei ao Claude Code a descrição do problema, e ele gerou em uma hora o que nós levamos um ano para construir." Ela estava se referindo a um sistema de orquestração de agentes distribuídos que sua equipe levou um ano para desenvolver, e que o Claude Code conseguiu aproximar a partir de um prompt de três parágrafos.

Essa justaposição é instrutiva. Enquanto o Claude Code da Anthropic cativou a imaginação com demonstrações de desenvolvimento de software de ponta a ponta, a Nous Research está posicionando o NousCoder-14B como uma alternativa open-source poderosa. Sua estratégia baseia-se na crença de que modelos treinados em problemas verificáveis podem preencher a lacuna de capacidade e que a transparência no processo de construção do modelo é tão crucial quanto o desempenho bruto.

Transparência e Reprodutibilidade: A Distinção do NousCoder-14B

O que realmente diferencia o lançamento do NousCoder-14B de muitos anúncios de concorrentes é seu compromisso com a abertura radical. A Nous Research não publicou apenas os pesos do modelo, mas também todo o ambiente de aprendizado por reforço, o conjunto de benchmarks e o framework de treinamento, todos construídos sobre o framework Atropos da empresa. Esta publicação abrangente permite que qualquer pesquisador com recursos computacionais suficientes replique ou expanda seu trabalho.

"Tornar o stack Atropos open-source fornece a infraestrutura necessária para pesquisas reproduzíveis de raciocínio em nível olímpico", observou um observador no X, resumindo o profundo significado dessa abordagem para as comunidades acadêmicas e de código aberto.

O modelo foi treinado por Joe Li, pesquisador da Nous Research e ex-programador competitivo. O relatório técnico de Li oferece uma perspectiva pessoal, comparando a trajetória de desempenho do modelo com sua própria jornada no Codeforces, uma popular plataforma de programação competitiva. Ele mapeou as pontuações do LiveCodeBench para os rankings do Codeforces, estimando que a melhoria do NousCoder-14B – de uma faixa de ranking aproximada de 1600-1750 para 2100-2200 – reflete um salto que lhe custou quase dois anos de prática dedicada entre os 14 e 16 anos de idade. O modelo alcançou esse progresso equivalente em apenas quatro dias.

"Observar a execução final do treinamento foi uma experiência bastante surreal", escreveu Li no relatório técnico. No entanto, ele também apontou uma advertência importante sobre a eficiência da IA: enquanto ele resolveu cerca de 1.000 problemas durante seus dois anos de prática, o modelo exigiu 24.000 problemas. Isso ressalta que, pelo menos por enquanto, os humanos permanecem aprendizes significativamente mais eficientes em termos de número de amostras.

Dentro do Sistema de Aprendizado por Reforço: Treinamento em 24.000 Problemas

O processo de treinamento do NousCoder-14B oferece uma visão das técnicas sofisticadas que os pesquisadores empregam para aprimorar as capacidades de raciocínio da IA por meio do aprendizado por reforço. A metodologia principal baseia-se no que os pesquisadores chamam de "recompensas verificáveis". Neste sistema, o modelo gera soluções de código, que são então executadas contra casos de teste. O modelo recebe um simples sinal de feedback binário: correto ou incorreto. Embora conceitualmente simples, este loop de feedback exige uma infraestrutura considerável para execução em larga escala.

A Nous Research utilizou o Modal, uma plataforma de computação em nuvem, para executar execuções de código isoladas (sandboxed) em paralelo. Cada um dos 24.000 problemas de treinamento inclui, em média, centenas de casos de teste. O sistema deve verificar rigorosamente que o código gerado produz resultados corretos dentro de limites estritos de tempo e memória – 15 segundos e 4 gigabytes, respectivamente.

O treinamento empregou uma técnica chamada DAPO (Dynamic Sampling Policy Optimization), que os pesquisadores consideraram ligeiramente melhor do que alternativas em seus experimentos. Uma inovação chave é a "amostragem dinâmica" – descartar exemplos de treinamento nos quais o modelo resolve todas as tentativas ou falha em todas as tentativas, pois estes não fornecem nenhum sinal de gradiente útil para o aprendizado.

Os pesquisadores também adotaram a "extensão iterativa de contexto", treinando inicialmente o modelo com uma janela de contexto de 32.000 tokens antes de expandi-la para 40.000 tokens. Durante a avaliação, estender o contexto para aproximadamente 80.000 tokens produziu os melhores resultados, atingindo a taxa de precisão de 67,87%.

Mais significativamente, o pipeline de treinamento sobrepõe inferência e verificação – assim que o modelo gera uma solução, ele começa a trabalhar no próximo problema enquanto a solução anterior está sendo verificada. Esse pipeline, combinado com o treinamento assíncrono onde múltiplas instâncias do modelo trabalham em paralelo, maximiza a utilização de hardware em caros clusters de GPU.

Notícias relacionadas

A Imiente Escassez de Dados: Um Potencial Gargalo para o Progresso da IA

Uma descoberta crucial está incorporada no relatório técnico de Li, uma que tem implicações significativas para a trajetória futura do desenvolvimento de IA: o conjunto de dados de treinamento para NousCoder-14B abrange "uma porção significativa de todos os problemas de programação competitiva prontamente disponíveis e verificáveis em um formato de conjunto de dados padronizado".

Em essência, para este domínio específico, os pesquisadores estão se aproximando dos limites de dados de treinamento de alta qualidade. "O número total de problemas de programação competitiva na Internet é aproximadamente da mesma ordem de magnitude", escreveu Li, referindo-se aos 24.000 problemas usados para treinamento. "Isso sugere que, dentro do domínio da programação competitiva, alcançamos os limites de dados de alta qualidade."

Essa observação ecoa as crescentes preocupações na comunidade de IA sobre a escassez de dados, particularmente em campos especializados. Embora a transparência e o acesso aberto sejam vitais para o progresso coletivo, a disponibilidade de dados de treinamento de alta qualidade pode em breve se tornar uma restrição primária para o desenvolvimento avançado de IA.

Agência de Notícias Ekhbary

Nous Research lança NousCoder-14B: Modelo de Codificação Open-Source Desafia Gigantes Proprietários

Novo modelo de programação competitiva treinado em tempo rec