观点网 on MSN
MiniMax宣布开源面向Coding Agent的新评测集
MiniMax开源OctoCodingBench评测集,测试显示主流模型Check级准确率超80%,Instance级成功率仅10%-30%,多轮指令遵循能力衰减明显,开源模型正加速逼近闭源模型。
事实上,Linus在做客LinusTechTips的那期视频里表示过,自己玩的一直都是人肉vibe-coding 每当他要给Linux添加什么新代码,一般都是发个集体邮件,询问有没有人愿意写,然后直接坐等代码上门 ...
说实话我还挺期待 MiniMax 发布新模型的,之前的 M2.1 确实能打。不过,今天看到消息,MiniMax 上市之后发布了第一个开源项目: OctoCodingBench 。
在这种角色下,这位老哥过去对“AI 帮你写代码”这套叙事,一直保持高度警惕甚至是嗤之以鼻——他关注重点的不是代码写得快不快,而是代码在多年之后是否还能被理解、维护和演进。
该AI初创公司此前曾在去年的9月份进行过一次融资,当时的融资额约为2.5亿美元,估值约为30亿美元,意味着该公司最新估值比上一轮几乎翻了三倍。支持该公司的核心机构投资者包括Amex Ventures、美国科技巨头谷歌旗下的 AI Futures ...
话题背景当AI帮你敲下那一行行“完美”代码时,有些悄悄埋下的坑是否让你倒吸凉气!今天,我们盘点那些AI Coding令人扶额的翻车现场,以及一些防坑指南,让你在AI编程时代,少走弯路,多些从容。以下为10位鹅厂同事们分享的“AI ...
随着大模型从“能力展示”走向“真实应用”,AI 是否具备企业级生产力,正成为行业与资本市场共同关注的核心问题。近日, MiniMax ( 00100.HK ) 正式开源首个面向 Coding Agent 的系统性评测集 OctoCodingBench ,试图为下一代 AGI 的落地标准给出更清晰的答案。
首先是被多个AI Coding产品套壳的大模型厂商Claude正式推出Claude ...
Torvalds 特别强调了, 项目中的 Python 可视化工具基本上是靠「氛围编程(Vibe-Coding)」写出来的 。他起初只是采用典型的「搜索并照猫画虎」式编程,但后来省去了中间人(他自己), 直接让 Google Antigravity ...
【导读】Andrej Karpathy震惊硅谷的推文揭开了编程史上最剧烈的变局,软件工程正在经历一场9级地震。当,当Rust创始人DHH在网上疯狂安利AI编程,当一个澳洲养羊农民用5行代码逼疯硅谷精英,我们必须直面一个残酷的现实:编程领域的AGI奇点 ...
近日,MiniMax 正式宣布开源其全新 M2.1编程模型,标志着其在人工智能领域的重要进展。这一模型现已同步上线于 Hugging Face、ModelScope 以及 GitHub 等多个平台,方便开发者们快速接入与使用。 M2.1的发布不仅是对开发者的一个重大利好,它还获得了 vLLM 的 “Day-0” 支持,这意味着开发者能够在模型发布的第一时间就享受到高效的推理性能。此外,MiniMa ...
埃隆·马斯克旗下的人工智能公司 xAI 正在编程领域酝酿大动作。xAI 正准备推出一款名为 Grok Build 的全新产品,其核心理念为当下火热的“氛围式编程”(Vibe Coding)。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果