资讯模型与产品··来源: VentureBeat·原文 →

Nous Research 发布开源代码模型 NousCoder-14B,4 天训练挑战 Claude Code

获加密风投 Paradigm 支持的开源 AI 初创公司 Nous Research 发布 NousCoder-14B 编程模型,仅用 48 张英伟达 B200 GPU 训练 4 天即达 67.87% LiveCodeBench 准确率,超越基座模型 7 个百分点。发布时机恰逢 Anthropic Claude Code 引发社交媒体热议,开源与闭源编程助手竞争白热化。

Nous Research 发布开源代码模型 NousCoder-14B,4 天训练挑战 Claude Code
[广告位 · 上线后接 AdSense]

4天训练吊打闭源巨头,开源编程模型杀疯了

加密风投Paradigm押注的开源AI新秀Nous Research本周放大招,推出新一代编程模型NousCoder-14B——仅用4天时间和48张英伟达B200显卡,就在编程竞赛任务中干翻多个闭源大模型。

这波操作时机很妙。元旦以来,Anthropic的Claude Code持续霸榜热搜,开发者集体高潮。谷歌Gemini API负责人Jaana Dogan上周在X平台发帖引爆全网:"我给Claude Code描述需求,1小时就搞定了我们团队去年肝了一年的分布式智能体系统!"

性能炸裂:直接碾压基座模型7个点

技术报告显示,NousCoder-14B在LiveCodeBench v6评测中拿下67.87%准确率。这个测试用的都是2024年8月到2025年5月的新题,比基座模型阿里的Qwen3-14B直接提升7.08个百分点

开源和闭源的这场Battle暴露了AI编程的进化速度:当Anthropic靠炫酷Demo吸粉时,Nous Research赌的是用可验证问题训练的开源方案也能打,而且模型透明度比啥都重要。

真·开源:连裤衩都给你看

和那些假开源选手不同,NousCoder-14B这次玩真的:不仅放出模型权重,还把强化学习环境、测试套件和训练工具链全开源了——整套东西都基于自研的Atropos框架,有显卡就能复现。

X平台老哥锐评:"Atropos技术栈开源,相当于给奥赛级推理研究送上了全家桶。"这对学术界意味着什么,懂的都懂。

模型由Nous Research驻场研究员、前竞赛大佬Joe Li操刀。技术报告里还藏了个彩蛋(原文到这儿断了,但按惯例会曝训练过程中的骚操作)。

给中国开发者的启示

这个案例对中国AI人有两个暴击:4天极限训练工具链全开放。在算力贵上天的今天,Nous Research证明中小团队只要优化训练流程、死磕特定场景(比如编程竞赛),照样能搞出能打的模型。开源的Atropos框架更是直接给国内研究者送了套奥赛级训练装备,教育、竞赛辅导这些场景直接抄作业就行。

业内共识是AI编程即将成为基操,这场开源闭源的大乱斗,好戏才刚开始。


本文基于 VentureBeat 报道, 由 AiDuo123 AI 编辑翻译改写。原文链接: https://venturebeat.com/technology/nous-researchs-nouscoder-14b-is-an-open-source-coding-model-landing-right-in

常见问题

NousCoder-14B 的 67.87% 准确率在业内处于什么水平?
根据原文,该模型在 LiveCodeBench v6 基准上的表现与多个更大规模的专有系统相当或更优,比基座模型 Qwen3-14B 提升 7.08 个百分点。LiveCodeBench 采用 2024-2025 年最新竞赛题目,67.87% 的准确率表明模型已具备较强的竞争性编程能力,但具体排名需参照同期其他模型的公开评测数据。
4 天训练时间是否意味着任何团队都能复现?
原文明确提到使用了 48 张英伟达 B200 GPU。B200 是英伟达最新一代数据中心 GPU(通常单卡成本数万美元),48 卡集群的硬件投入和电力成本仍然不低。不过相比动辄数周的大模型训练,4 天周期确实大幅降低了时间成本,且 Nous Research 开源了完整训练工具链,具备相应算力的团队理论上可以复现。
Atropos 框架开源对中国开发者有哪些实际用途?
根据原文,Atropos 是 Nous Research 用于构建强化学习环境、基准测试和训练工具的完整技术栈。开源后,国内研究者可直接用于:1)竞赛编程辅导系统开发;2)垂直领域代码生成模型训练(如特定框架或语言);3)教育场景的自动出题与评测;4)在开源基座模型上进行针对性微调实验,而无需从零搭建训练基础设施。
[广告位 · 上线后接 AdSense]
标签:#OpenAI

同类资讯 — 由发布时间排序

Pool 应用将手机截图变为可搜索记忆库 获 200 万美元融资

Pool 应用将手机截图变为可搜索记忆库 获 200 万美元融资

新应用 Pool 通过 AI 技术将用户手机中杂乱的截图自动分类整理,并追溯原始链接。这款由 Spinoff Studio 推出的工具已获 General Catalyst 等机构超 200 万美元 pre-seed 融资,现已在 iOS 平台免费上线,计划推出个人助理类衍生应用。

应用与案例融资动态
美国政府或将持股 OpenAI 等 AI 公司 参照英特尔模式推进

美国政府或将持股 OpenAI 等 AI 公司 参照英特尔模式推进

美国政府持有 AI 公司股权的讨论已从理论进入实质谈判阶段,时机恰逢 OpenAI 等公司 IPO 窗口期。参照英特尔案例,政府可能以无投票权股份、低于市场价格入股,但这将给投资者带来治理不确定性与稀释风险。主动捐赠股权的公司或可换取监管宽松,但政府进入股东名单将改写整个行业估值逻辑。

政策与安全OpenAI
OpenAI 预计一年内上市,估值已达 860 亿美元

OpenAI 预计一年内上市,估值已达 860 亿美元

据 The Information 援引知情人士消息,OpenAI 预计将在未来一年内启动 IPO。此前该公司刚完成员工股份二级市场交易,估值达 860 亿美元,较今年 2 月的 290 亿美元估值大幅跃升近 3 倍,显示投资者对生成式 AI 领头羊的持续看好。

行业动态OpenAI
谷歌 Gemini 成阿根廷国家队主赞助商,AI 首次全面进入世界杯

谷歌 Gemini 成阿根廷国家队主赞助商,AI 首次全面进入世界杯

谷歌与阿根廷足协达成合作,Gemini 成为国家队全球主赞助商,其 Logo 将出现在训练服上。AI 将用于球队战术分析、对手数据研判和球迷互动内容生成。谷歌已同时签约巴西和法国队,将世界杯视为年度最重要文化事件,但 AI 在高压赛事环境中的表现仍面临全球级风险考验。

应用与案例谷歌