米兰·(milan)中国官方网站-被骂降智 1 个月后，Anthropic 端出了 Opus 4.7

2026-04-21 18:31:10

　　首页财产ai正文被骂降智 1 个月后，Anthropic 端出了 Opus 4.7 2026年，Claude Opus 4.6口碑下滑遭开发者声讨，4月16日Anthropic推出4.7，其能力显著晋升，该公司产物哲学或者改变，开发者生态受影响。 2026-04-17 14:22 ·微信公家号：极客公园桦林舞王 AI投资人解读· Opus 4.7比拟Opus 4.6有显著晋升，编码基准晋升13%，出产级使命自立完成率晋升3倍，还有带来高分辩率视觉撑持等。Cursor测试显示其自立编码乐成率从58%升至70%，且价格稳定。 · 行业竞争激烈，Anthropic需连结高频更新新分词器或者使企业挪用成本上升AI行业暂无同一能力评估尺度。总结：Opus 4.7揭示出强盛实力与投资潜力，但Anthropic面对竞争与尺度缺掉等挑战，投资时需综合考量其技能迭代连续性和行业情况变化。内容由AI天生，仅供参考

一家 AI 公司，到底做甚么会闪开发者气到于 GitHub 上，公然声讨一个 AI 模子「退化到不克不及用」？

已往几周，Claude Opus 4.6「疯狂降智」的会商满盈收集。

一名 AMD 的资深总监于 GitHub 上发了一篇广泛传播的帖子，直接写道「Claude 已经退化到没法信托履行繁杂工程的田地」。这篇帖子于开发者社区炸开了锅，无数人跑来补刀，说本身也有近似体验。

就于舆论发酵到最热的时辰，2026 年 4 月 16 日，Anthropic 悄然推出了 Claude Opus 4.7。

机会，耐人寻味。

0一、「退化」风浪，Anthropic 欠开发者一个谜底

要理解 Opus 4.7 的意义，患上先说清晰它呈现以前发生了甚么。

Opus 4.6 上线后，最初口碑不错。但跟着时间推移，开发者们最先陆续反应：这个模子于处置惩罚繁杂工程使命时，变患上愈来愈「守旧」，愈来愈轻易于多步调使命半途抛却，甚至最先给出「看起来合理但实在是错的」回覆。

这类「退化感」于 AI 产物里是最致命的信托危机。用户可以接管模子能力一般，但没法接管一个用熟了的东西忽然变患上不成靠。

从用数据角度看这件事，财报阐发平台 Hex 的评估申明了问题的素质。他们发明 Opus 4.6 于碰到数据抵牾时，会偏向在给出「看似合理的过错回退」，而不是老诚实实认可「数据缺掉，我无法回覆」。对于一个要用来做数据阐发的东西来讲，这比「不会用」还有伤害。

Anthropic 对于这些反馈的回应方式是，直接上新版本。没有公然的注释，没有「咱们听到了」的官方声明，就是一个新模子上线了。

对于技能公司来讲，这算是最直接的报歉方式。

0二、Opus 4.7 到底强于哪

Anthropic 给 Opus 4.7 打的标签是「软件工程范畴的显著晋升」，并引入了一个全新的 xhigh 努力等级。

从详细数字来看，编码基准晋升了 13%，出产级使命的自立完成率晋升了 3 倍，同时还有带来了高达 3.75 兆像素的高分辩率视觉撑持及更新的分词器。

但这些官方数字对于开发者来讲太抽象。更有说服力的是来自 Cursor 团队的反馈。Cursor 是今朝最受开发者青睐的 AI 编程东西之一，他们用本身的内部基准 CursorBench 测试了 Opus 4.7，成果是自立编码乐成率从 Opus 4.6 的 58% 跳升到了 70%。

12 个百分点的差距，听起来不年夜，但放于「自立完成繁杂使命」这个维度上，意义彻底差别。

已往于 Opus 4.6 上需要两到三次提醒才能弄定的使命，于 4.7 上凡是一次就能跑通。对于真正于事情流里深度依靠 AI 的开发者来讲，这直接等在削减了一半以上的往返调试成本。

Hex 对于 Opus 4.7 的评价，则从另外一个维度印证了此次进级的质量。他们直接说这是「评估过最强盛的模子」，焦点理由是它于面临数据抵牾时，再也不试图给出貌似合理的过错谜底，而是选择照实奉告「数据缺掉」。这听起来像是一个很小的举动变化，但它指向的是模子「自知能力界限」这个更深层的前进。

价格没有变化。输入每一百万 token 5 美元，输出每一百万 token 25 美元，及 Opus 4.6 彻底一致。

0三、两周三更新，Anthropic 于打甚么算盘

假如只是看这一次发布，Opus 4.7 是一次扎实的迭代进级。但把时间线拉长到已往两个月，此次更新的暗地里逻辑就更成心思了。

2026 年 1 月以来，Anthropic 约莫连结着每一两周一次庞大更新的节拍。这个频率，于 AI 武备竞赛最激烈的今天，自己就是一种战略亮相：

「咱们于跑，咱们不会停」。

更值患上存眷的是与此同时发生的另外一件事。

就于 Opus 4.7 发布前几周，Anthropic 向精选企业客户暗暗开放了 Claude Mythos Preview，这是作为 Project Glasswing 收集安全规划的一部门。

这个模子的能力之强让人警惕，据报导它可以或许渗入重要银行体系，且具有同时进犯多个方针的潜力。Anthropic 结合开创人杰克·克拉克专门向特朗普当局做了报告请示，财务部长斯科特·贝森特及美联储主席鲍威尔随后也紧迫招集了与银行高管的集会。

这象征着 Anthropic 此刻同时于打两场战役。一场是公然的、对于着开发者及企业客户的产物战，Opus 4.7 是这场战役里的一颗棋子；另外一场是关在 AI 能力界限的政策博弈，Mythos 及 Project Glasswing 是这条线上更敏感的棋局。

这两件事放于一路看，你会发明 Anthropic 的产物哲学，正于发生微妙的改变。他们愈来愈清晰，最强盛的模子不克不及直接扔给所有人用，但也不克不及把「充足强」的模子做差了。

Opus 4.7 饰演的，就是这个「充足强但可控部署」的脚色。

0四、开发者生态的新格式

Opus 4.7 的发布，对于整个开发者东西生态的象征，不只是「Claude 又更新了」这么简朴。

编程助手这个赛道，今天已经经是一场关在「事情流深度绑定」的战役。Cursor 选择把 Opus 4.7 作为焦点模子接入，这暗地里是一个明确的判定，于当前竞争格式里，Claude 系列对于繁杂软件工程使命的理解深度，依然有较着上风。

VentureBeat 的一个阐发视角颇有意思，他们认为Opus 4.7 代表的，是 AI 从「创意助手」向「靠得住履行者」的脚色迁徙。这个说法实在道出了企业采购决议计划的焦点逻辑，创意助手可以偶然堕落，但履行者不行。

不外，也有值患上注意的隐患。新分词器的引入象征着，一样的输入文本可能会耗损更多 token，虽然单价稳定，但现实成本有可能暗暗上涨。这对于高频挪用 API 的企业来讲，是需要从头测算的变量。

还有有一个更底子的问题，正如 Decrypt 的评论所指出的，AI 行业至，今仍没有一套各人都承认的能力评估尺度。Anthropic 说编码基准晋升了 13%，但这个基准及真实开发场景之间的间隔，每一个人的感触感染都纷歧样。Cursor 的 70% 乐成率数据，比 Anthropic 本身发布的所有基准都更有说服力，恰是由于它来自真实事情流里的现实验证。

几周前，开发者于 GitHub 上公然诉苦 Opus 4.6「不克不及用了」。今天，Anthropic 用一个新版本回应了这份不满，而且用实打实的机能数据赢回了 Cursor、Hex 这些头部东西团队的违书。

但用户的信托不是靠一次发布能完全修复的。每一两周一次的迭代节拍，既是上风，也是压力，由于它象征着每一次发布都必需真的好，不然下一轮「退化」的声音会来患上更快。

对于 Anthropic 来讲，真实的磨练不是今天能不克不及发出一个更好的版本，而是能不克不及闪开发者信赖，这个「更好」是连续的、可预期的。

这对于任何 AI 公司来讲，都是一个巨年夜的挑战。

【本文由投资界互助伙伴微信公家号：极客公园授权发布，本平台仅提供信息存储办事。】若有任何疑难，请接洽（editor@zero2ipo.com.cn）投资界处置惩罚。

-米兰·(milan)中国官方网站

产品

服务

关于米兰milan

信息公开

产品 +

服务 +

关于米兰milan +

信息公开 +

投资者关系

加入米兰milan

客户留言