资讯模型与产品··来源: VentureBeat·原文 →

Nous Research 发布开源代码模型 NousCoder-14B,4 天训练挑战 Claude Code

获加密风投 Paradigm 支持的开源 AI 初创公司 Nous Research 发布 NousCoder-14B 编程模型,仅用 48 张英伟达 B200 GPU 训练 4 天即达 67.87% LiveCodeBench 准确率,超越基座模型 7 个百分点。发布时机恰逢 Anthropic Claude Code 引发社交媒体热议,开源与闭源编程助手竞争白热化。

Nous Research 发布开源代码模型 NousCoder-14B,4 天训练挑战 Claude Code
[广告位 · 上线后接 AdSense]

4天训练吊打闭源巨头,开源编程模型杀疯了

加密风投Paradigm押注的开源AI新秀Nous Research本周放大招,推出新一代编程模型NousCoder-14B——仅用4天时间和48张英伟达B200显卡,就在编程竞赛任务中干翻多个闭源大模型。

这波操作时机很妙。元旦以来,Anthropic的Claude Code持续霸榜热搜,开发者集体高潮。谷歌Gemini API负责人Jaana Dogan上周在X平台发帖引爆全网:"我给Claude Code描述需求,1小时就搞定了我们团队去年肝了一年的分布式智能体系统!"

性能炸裂:直接碾压基座模型7个点

技术报告显示,NousCoder-14B在LiveCodeBench v6评测中拿下67.87%准确率。这个测试用的都是2024年8月到2025年5月的新题,比基座模型阿里的Qwen3-14B直接提升7.08个百分点

开源和闭源的这场Battle暴露了AI编程的进化速度:当Anthropic靠炫酷Demo吸粉时,Nous Research赌的是用可验证问题训练的开源方案也能打,而且模型透明度比啥都重要。

真·开源:连裤衩都给你看

和那些假开源选手不同,NousCoder-14B这次玩真的:不仅放出模型权重,还把强化学习环境、测试套件和训练工具链全开源了——整套东西都基于自研的Atropos框架,有显卡就能复现。

X平台老哥锐评:"Atropos技术栈开源,相当于给奥赛级推理研究送上了全家桶。"这对学术界意味着什么,懂的都懂。

模型由Nous Research驻场研究员、前竞赛大佬Joe Li操刀。技术报告里还藏了个彩蛋(原文到这儿断了,但按惯例会曝训练过程中的骚操作)。

给中国开发者的启示

这个案例对中国AI人有两个暴击:4天极限训练工具链全开放。在算力贵上天的今天,Nous Research证明中小团队只要优化训练流程、死磕特定场景(比如编程竞赛),照样能搞出能打的模型。开源的Atropos框架更是直接给国内研究者送了套奥赛级训练装备,教育、竞赛辅导这些场景直接抄作业就行。

业内共识是AI编程即将成为基操,这场开源闭源的大乱斗,好戏才刚开始。


本文基于 VentureBeat 报道, 由 AiDuo123 AI 编辑翻译改写。原文链接: https://venturebeat.com/technology/nous-researchs-nouscoder-14b-is-an-open-source-coding-model-landing-right-in

常见问题

NousCoder-14B 的 67.87% 准确率在业内处于什么水平?
根据原文,该模型在 LiveCodeBench v6 基准上的表现与多个更大规模的专有系统相当或更优,比基座模型 Qwen3-14B 提升 7.08 个百分点。LiveCodeBench 采用 2024-2025 年最新竞赛题目,67.87% 的准确率表明模型已具备较强的竞争性编程能力,但具体排名需参照同期其他模型的公开评测数据。
4 天训练时间是否意味着任何团队都能复现?
原文明确提到使用了 48 张英伟达 B200 GPU。B200 是英伟达最新一代数据中心 GPU(通常单卡成本数万美元),48 卡集群的硬件投入和电力成本仍然不低。不过相比动辄数周的大模型训练,4 天周期确实大幅降低了时间成本,且 Nous Research 开源了完整训练工具链,具备相应算力的团队理论上可以复现。
Atropos 框架开源对中国开发者有哪些实际用途?
根据原文,Atropos 是 Nous Research 用于构建强化学习环境、基准测试和训练工具的完整技术栈。开源后,国内研究者可直接用于:1)竞赛编程辅导系统开发;2)垂直领域代码生成模型训练(如特定框架或语言);3)教育场景的自动出题与评测;4)在开源基座模型上进行针对性微调实验,而无需从零搭建训练基础设施。
[广告位 · 上线后接 AdSense]
标签:#OpenAI

相关 AI 工具

文中提到或相关的 AI 工具 — 点进去看适合谁、怎么用、值不值得折腾

浏览全部工具 →

同类资讯 — 由发布时间排序

前OpenAI CTO穆拉蒂"创意岗位消失论"引争议

前OpenAI CTO穆拉蒂"创意岗位消失论"引争议

OpenAI前首席技术官Mira Murati近期关于AI与就业的言论引发热议。她表示"某些创意工作可能会消失,但也许它们本就不该存在",这一观点在科技界和创意行业引发激烈讨论。该言论折射出AI领军企业高管对技术冲击就业市场的态度,值得中国AI从业者关注。

行业动态OpenAI
OpenAI 遭美国三州联合调查:IPO 前夕面临用户伤害与数据合规审查

OpenAI 遭美国三州联合调查:IPO 前夕面临用户伤害与数据合规审查

美国康涅狄格州、纽约州和伊利诺伊州总检察长联合启动对 OpenAI 的调查,重点关注其产品可能对消费者(尤其是儿童)造成的伤害、隐私保护、数据准确性及偏见问题。此次调查正值 OpenAI 传出计划 IPO 之际,叠加今年 5 月联邦贸易委员会(FTC)已对其虚假信息风险展开调查,监管压力显著升级。

政策与安全OpenAI
纽约州总检察长向 OpenAI 发传票 数据采集与内容安全成调查焦点

纽约州总检察长向 OpenAI 发传票 数据采集与内容安全成调查焦点

纽约州总检察长办公室已向 OpenAI 发出传票,调查其数据采集实践是否存在消费者保护违规,以及 AI 模型生成有害内容的风险。此次调查聚焦 ChatGPT 等大语言模型训练数据的获取与使用是否充分告知用户并取得合规授权,标志着监管机构对 AI 企业的审查进入更严格阶段。

政策与安全OpenAI
谷歌起诉 AI 驱动诈骗团伙:9000 个假网站与 250 万条钓鱼短信

谷歌起诉 AI 驱动诈骗团伙:9000 个假网站与 250 万条钓鱼短信

谷歌已向加州联邦法院提起诉讼,指控一个利用人工智能技术批量生成约 9000 个钓鱼网站、发送超过 250 万条诈骗短信的犯罪团伙。被告利用 AI 工具自动化伪造品牌官网、政府机构页面,通过短信钓鱼(smishing)窃取用户登录凭证与金融信息。此案凸显 AI 技术被滥用于网络犯罪的新风险。

政策与安全谷歌