Anthropic 宣布推出 Claude 3.7 Sonnet,称这是其迄今为止最智能的模型,也是市场上首款混合推理模型。同时还推出了用于代理编码的命令行工具 Claude Code(研究预览版),使开发者可直接通过终端将重要工程任务委托给 Claude 完成。
公告称,Claude 3.7 Sonnet 的理念与市场上其他推理模型不同。“正如人类使用单个大脑进行快速反应和深度思考一样,我们认为推理应该是前沿模型的综合能力,而不是完全独立的模型。这种统一的方法也为用户创造了更无缝的体验。”
Claude 3.7 Sonnet既是普通LLM也是推理模型:用户可以选择何时让模型正常回答,何时在回答前进行更长时间的思考。在标准模式下,Claude 3.7 Sonnet是Claude 3.5 Sonnet的升级版。在扩展思考模式下,它会在回答前进行自我反思,从而在数学、物理、指令遵循、编码等许多任务上提高其性能。在两种模式下对模型的提示效果相似。
通过API使用Claude 3.7 Sonnet时,用户还可以控制思考的“预算”:可以告诉Claude思考不超过N个token,其中N的值可以是任意值,直到其输出限制的128K个令牌。这允许用户在速度(和成本)与答案质量之间进行权衡。
Anthropic 称,他们在开发推理模型时,对数学和计算机科学竞赛问题的优化较少,而是将重点转向更能反映企业实际如何使用 LLM 的现实任务。
早期测试表明,Claude 在编码能力方面全面领先:Cursor 指出,Claude 在实际编码任务中再次名列前茅,在处理复杂代码库和高级工具使用等领域都有显著改进。Cognition 发现,在规划代码更改和处理全栈更新方面,Claude 远胜于任何其他模型。Vercel 强调了 Claude 在复杂代理工作流程中的卓越精确度,而 Replit 已成功部署 Claude 从头开始构建复杂的 Web 应用程序和仪表板,而其他模型则停滞不前。在 Canva 的评估中,Claude 始终如一地生成可用于生产的代码,具有卓越的设计品味,并大大减少了错误。
目前 Claude 3.7 Sonnet 已全面支持所有Claude计划(包括免费版、专业版、团队版和企业版),以及Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI。且除免费 Claude 版外,扩展思考模式在所有计划上均可用。
在标准模式和扩展思考模式下,Claude 3.7 Sonnet 的价格与其前代产品相同:每百万输入令牌 3 美元,每百万输出令牌 15 美元——包括思考令牌。
更多详情可查看官方公告。
评论删除后,数据将无法恢复
Anthropic 推出 Claude 3.7 Sonnet 和 Claude Code
Anthropic 宣布推出 Claude 3.7 Sonnet,称这是其迄今为止最智能的模型,也是市场上首款混合推理模型。同时还推出了用于代理编码的命令行工具 Claude Code(研究预览版),使开发者可直接通过终端将重要工程任务委托给 Claude 完成。
公告称,Claude 3.7 Sonnet 的理念与市场上其他推理模型不同。“正如人类使用单个大脑进行快速反应和深度思考一样,我们认为推理应该是前沿模型的综合能力,而不是完全独立的模型。这种统一的方法也为用户创造了更无缝的体验。”
Claude 3.7 Sonnet既是普通LLM也是推理模型:用户可以选择何时让模型正常回答,何时在回答前进行更长时间的思考。在标准模式下,Claude 3.7 Sonnet是Claude 3.5 Sonnet的升级版。在扩展思考模式下,它会在回答前进行自我反思,从而在数学、物理、指令遵循、编码等许多任务上提高其性能。在两种模式下对模型的提示效果相似。
通过API使用Claude 3.7 Sonnet时,用户还可以控制思考的“预算”:可以告诉Claude思考不超过N个token,其中N的值可以是任意值,直到其输出限制的128K个令牌。这允许用户在速度(和成本)与答案质量之间进行权衡。
Anthropic 称,他们在开发推理模型时,对数学和计算机科学竞赛问题的优化较少,而是将重点转向更能反映企业实际如何使用 LLM 的现实任务。
目前 Claude 3.7 Sonnet 已全面支持所有Claude计划(包括免费版、专业版、团队版和企业版),以及Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI。且除免费 Claude 版外,扩展思考模式在所有计划上均可用。
在标准模式和扩展思考模式下,Claude 3.7 Sonnet 的价格与其前代产品相同:每百万输入令牌 3 美元,每百万输出令牌 15 美元——包括思考令牌。
更多详情可查看官方公告。