返回文章列表

2025-09-30

claude4.5发布!评分超GPT-5-codex,是王的回归还是一坨大的?

今天,Claude Sonnet 4.5 正式发布了!Anthropic 这次直接跳过了小版本,从 Sonnet 4 直达 4.5,可谓是诚意满满。话不多说,我们直接来看官方报告的重点解读。 官方一如既往的自信,开头就用连续三个“最好”来定义新模型: 最好的编码模型 最强的构建智能体(Agent)的模型 最好的操作计…

Claude-Sonnet-4.5 今日发布!

今天,Claude-Sonnet-4.5 正式发布了!Anthropic 这次直接跳过了小版本,从 Sonnet-4 直达 4.5,可谓是诚意满满。话不多说,我们直接来看官方报告的重点解读。

官方报告亮点

官方一如既往的自信,开头就用连续三个“最好”来定义新模型:

  • 最好的编码模型
  • 最强的构建智能体(Agent)的模型
  • 最好的操作计算机模型

定价

定价与 Sonnet-4 保持一致,输入为 $3/百万token,输出为 $15/百万token。

能力提升

编码能力:在编码测试 SWE-bench Verified 中分数最高,超过了 Codex 和 Opus 4.1。

计算机操作:任务上的提升巨大,从之前最高的 Sonnet-4 的 42% 提升到了 61%,可谓是巨幅提升。

专家领域:在金融、医疗、法律等专业领域的表现也都有较大提升。

总而言之,单从官方数据来看,旧王回归,碾压 Codex 似乎是妥妥的了。但实际上手能否真正超过 Codex 重登王座,还需要我们亲自体验。

如何体验 Sonnet-4.5

  • 官方渠道

官方网页和 Claude Code 均已上线新模型。免费用户也可以在网页上享受每日的免费额度。

  • Cursor

已上线 Sonnet-4.5,价格等同于 Sonnet-4。有续费或教育优惠的朋友可以爽玩一阵~

  • 中转 API

许多中转 API 也已上线新模型,价格基本上比官方低了十几倍。有资源的朋友可以先玩起来了博主也在测试中有需要中转的朋友可以私我下。

但总而言之,按照 Claude 家的“尿性”,模型强是强,但中间会不会有啥 bug,有没有偷工减料降智,那还真说不准,毕竟之前俩月 Claude 基本没法用。大家还是要真实测试试一下。

另外,GPT 更新了,Claude 更新了,那 Gemini 3 还远吗?可以猛猛期待一波了!

原文发布于:https://mp.weixin.qq.com/s/JNGcQU9cYus6oVs82bpXWw