Claude开6倍价卖速度：AI推理进入奢侈品时代

当行业还在讨论如何把大模型成本打下来时，Anthropic反手推出了一个"反向操作"：Claude Opus 4.6 Fast Mode，速度提升2.5倍，价格暴涨6倍——输入token从$5/百万涨到$30/百万，输出从$25/百万飙到$150/百万。这不是技术升级，这是赤裸裸的阶级隔离。

本质上，Anthropic在卖的不是速度，而是"插队权"。 所谓的Fast Mode大概率不是什么算法突破，而是通过超配硬件资源（独占式GPU集群）brute-force出来的性能。6倍成本换2.5倍加速，这个糟糕的投入产出比暴露了一个残酷现实：高质量低延迟的推理算力仍然是稀缺资源。Anthropic不再掩饰这种稀缺性，而是选择用价格杠杆进行配给——把算力优先分配给愿意支付溢价的"商务舱"客户。

这种定价策略标志着AI API市场从"按智力付费"转向"按服务质量（QoS）付费"。过去选模型是选智商（Small/Medium/Large），现在则是选体验（Fast-HighQuality vs Slow-HighQuality）。对实时金融交易、紧急代码审查这些"毫秒值千金"的场景，$150/百万token反而便宜；但对普通开发者，这扇门将彻底关闭。更微妙的是，6倍溢价反向锚定了标准版的"性价比"，迫使企业在"慢且省"和"快且贵"之间做极端选择。

这场实验揭示了两个趋势。 第一，大模型厂商开始放弃"规模经济快速降价"的幻想，转向"价值定价"——承认算力就是权力，速度就是金钱。第二，这可能暴露Anthropic在模型架构效率上的短板：为什么需要6倍成本才能换2.5倍速度？竞争对手如果能在算法层面实现同等加速，将对其形成降维打击。

未来的AI市场不会是一个扁平的民主广场，而会分裂为"头等舱"和"经济舱"。速度，正在成为数字化时代的最新奢侈品。

原文链接：Anthropic rolls out a fast mode for Claude Opus 4.6 in research preview, saying it offers the same model quality 2.5 times faster but costs six times more (Simon Willison/Simon Willison’s Weblog)

本文由 AI 辅助生成，仅供参考。