
首页财产ai正文 被骂降智 1 个月后,Anthropic 端出了 Opus 4.7 2026年,Claude Opus 4.6口碑下滑遭开发者声讨,4月16日Anthropic推出4.7,其能力显著晋升,该公司产物哲学或者改变,开发者生态受影响。 2026-04-17 14:22 ·微信公家号:极客公园桦林舞王 AI投资人解读· Opus 4.7比拟Opus 4.6有显著晋升,编码基准晋升13%,出产级使命自立完成率晋升3倍,还有带来高分辩率视觉撑持等。Cursor测试显示其自立编码乐成率从58%升至70%,且价格稳定。 · 行业竞争激烈,Anthropic需连结高频更新新分词器或者使企业挪用成本上升AI行业暂无同一能力评估尺度。 总结:Opus 4.7揭示出强盛实力与投资潜力,但Anthropic面对竞争与尺度缺掉等挑战,投资时需综合考量其技能迭代连续性和行业情况变化。内容由AI天生,仅供参考 一家 AI 公司,到底做甚么会闪开发者气到于 GitHub 上,公然声讨一个 AI 模子「退化到不克不及用」? 已往几周,Claude Opus 4.6「疯狂降智」的会商满盈收集。 一名 AMD 的资深总监于 GitHub 上发了一篇广泛传播的帖子,直接写道「Claude 已经退化到没法信托履行繁杂工程的田地」。这篇帖子于开发者社区炸开了锅,无数人跑来补刀,说本身也有近似体验。 就于舆论发酵到最热的时辰,2026 年 4 月 16 日,Anthropic 悄然推出了 Claude Opus 4.7。 机会,耐人寻味。 0一、「退化」风浪,Anthropic 欠开发者一个谜底 要理解 Opus 4.7 的意义,患上先说清晰它呈现以前发生了甚么。 Opus 4.6 上线后,最初口碑不错。但跟着时间推移,开发者们最先陆续反应:这个模子于处置惩罚繁杂工程使命时,变患上愈来愈「守旧」,愈来愈轻易于多步调使命半途抛却,甚至最先给出「看起来合理但实在是错的」回覆。 这类「退化感」于 AI 产物里是最致命的信托危机。用户可以接管模子能力一般,但没法接管一个用熟了的东西忽然变患上不成靠。 从用数据角度看这件事,财报阐发平台 Hex 的评估申明了问题的素质。他们发明 Opus 4.6 于碰到数据抵牾时,会偏向在给出「看似合理的过错回退」,而不是老诚实实认可「数据缺掉,我无法回覆」。对于一个要用来做数据阐发的东西来讲,这比「不会用」还有伤害。 Anthropic 对于这些反馈的回应方式是,直接上新版本。没有公然的注释,没有「咱们听到了」的官方声明,就是一个新模子上线了。 对于技能公司来讲,这算是最直接的报歉方式。 0二、Opus 4.7 到底强于哪 Anthropic 给 Opus 4.7 打的标签是「软件工程范畴的显著晋升」,并引入了一个全新的 xhigh 努力等级。 从详细数字来看,编码基准晋升了 13%,出产级使命的自立完成率晋升了 3 倍,同时还有带来了高达 3.75 兆像素的高分辩率视觉撑持及更新的分词器。 但这些官方数字对于开发者来讲太抽象。更有说服力的是来自 Cursor 团队的反馈。Cursor 是今朝最受开发者青睐的 AI 编程东西之一,他们用本身的内部基准 CursorBench 测试了 Opus 4.7,成果是自立编码乐成率从 Opus 4.6 的 58% 跳升到了 70%。 12 个百分点的差距,听起来不年夜,但放于「自立完成繁杂使命」这个维度上,意义彻底差别。 已往于 Opus 4.6 上需要两到三次提醒才能弄定的使命,于 4.7 上凡是一次就能跑通。对于真正于事情流里深度依靠 AI 的开发者来讲,这直接等在削减了一半以上的往返调试成本。 Hex 对于 Opus 4.7 的评价,则从另外一个维度印证了此次进级的质量。他们直接说这是「评估过最强盛的模子」,焦点理由是它于面临数据抵牾时,再也不试图给出貌似合理的过错谜底,而是选择照实奉告「数据缺掉」。这听起来像是一个很小的举动变化,但它指向的是模子「自知能力界限」这个更深层的前进。 价格没有变化。输入每一百万 token 5 美元,输出每一百万 token 25 美元,及 Opus 4.6 彻底一致。 0三、两周三更新,Anthropic 于打甚么算盘 假如只是看这一次发布,Opus 4.7 是一次扎实的迭代进级。但把时间线拉长到已往两个月,此次更新的暗地里逻辑就更成心思了。 2026 年 1 月以来,Anthropic 约莫连结着每一两周一次庞大更新的节拍。这个频率,于 AI 武备竞赛最激烈的今天,自己就是一种战略亮相: 「咱们于跑,咱们不会停」。 更值患上存眷的是与此同时发生的另外一件事。 就于 Opus 4.7 发布前几周,Anthropic 向精选企业客户暗暗开放了 Claude Mythos Preview,这是作为 Project Glasswing 收集安全规划的一部门。 这个模子的能力之强让人警惕,据报导它可以或许渗入重要银行体系,且具有同时进犯多个方针的潜力。Anthropic 结合开创人杰克·克拉克专门向特朗普当局做了报告请示,财务部长斯科特·贝森特及美联储主席鲍威尔随后也紧迫招集了与银行高管的集会。 这象征着 Anthropic 此刻同时于打两场战役。一场是公然的、对于着开发者及企业客户的产物战,Opus 4.7 是这场战役里的一颗棋子;另外一场是关在 AI 能力界限的政策博弈,Mythos 及 Project Glasswing 是这条线上更敏感的棋局。 这两件事放于一路看,你会发明 Anthropic 的产物哲学,正于发生微妙的改变。他们愈来愈清晰,最强盛的模子不克不及直接扔给所有人用,但也不克不及把「充足强」的模子做差了。 Opus 4.7 饰演的,就是这个「充足强但可控部署」的脚色。 0四、开发者生态的新格式 Opus 4.7 的发布,对于整个开发者东西生态的象征,不只是「Claude 又更新了」这么简朴。 编程助手这个赛道,今天已经经是一场关在「事情流深度绑定」的战役。Cursor 选择把 Opus 4.7 作为焦点模子接入,这暗地里是一个明确的判定,于当前竞争格式里,Claude 系列对于繁杂软件工程使命的理解深度,依然有较着上风。 VentureBeat 的一个阐发视角颇有意思,他们认为Opus 4.7 代表的,是 AI 从「创意助手」向「靠得住履行者」的脚色迁徙。这个说法实在道出了企业采购决议计划的焦点逻辑,创意助手可以偶然堕落,但履行者不行。 不外,也有值患上注意的隐患。新分词器的引入象征着,一样的输入文本可能会耗损更多 token,虽然单价稳定,但现实成本有可能暗暗上涨。这对于高频挪用 API 的企业来讲,是需要从头测算的变量。 还有有一个更底子的问题,正如 Decrypt 的评论所指出的,AI 行业至,今仍没有一套各人都承认的能力评估尺度。Anthropic 说编码基准晋升了 13%,但这个基准及真实开发场景之间的间隔,每一个人的感触感染都纷歧样。Cursor 的 70% 乐成率数据,比 Anthropic 本身发布的所有基准都更有说服力,恰是由于它来自真实事情流里的现实验证。 几周前,开发者于 GitHub 上公然诉苦 Opus 4.6「不克不及用了」。今天,Anthropic 用一个新版本回应了这份不满,而且用实打实的机能数据赢回了 Cursor、Hex 这些头部东西团队的违书。 但用户的信托不是靠一次发布能完全修复的。每一两周一次的迭代节拍,既是上风,也是压力,由于它象征着每一次发布都必需真的好,不然下一轮「退化」的声音会来患上更快。 对于 Anthropic 来讲,真实的磨练不是今天能不克不及发出一个更好的版本,而是能不克不及闪开发者信赖,这个「更好」是连续的、可预期的。 这对于任何 AI 公司来讲,都是一个巨年夜的挑战。 【本文由投资界互助伙伴微信公家号:极客公园授权发布,本平台仅提供信息存储办事。】若有任何疑难,请接洽(editor@zero2ipo.com.cn)投资界处置惩罚。