Table of Contents
https://www.anthropic.com/engineering/claude-think-tool?ref=blog.langchain.com
相关mcp: https://smithery.ai/server/@PhillipRt/think-mcp-server
核心概念
- “think” tool 的作用:
- 让模型在行动(如调用工具或回复用户)前暂停并进行结构化思考。
- 提供一个指定的空间(在模型的内部状态中)来记录和处理思考过程。
- 帮助模型更好地理解上下文、识别潜在问题、并确保其行动符合既定策略。
- “think” tool 与 Extended Thinking 的区别:
- “think” tool:模型开始生成响应后,添加一个步骤来思考。
- Extended Thinking:模型在开始生成响应之前进行的更深层次的思考和规划。
- 思考内容的重要性:
- 思考内容包括:对用户请求的解读、对相关规则和策略的分析、对之前工具调用结果的评估、对下一步行动的规划。
- 思考的内容比 “think” tool 本身的功能更重要。
think
tool 提供了一个结构化的框架,让模型能够更有效地进行推理。
使用方法
- 提示词设计:
- 结合 general instructions 和 specific examples 来引导 Claude 使用
think
tool。 - General instructions:告诉 Claude 何时 以及 如何 使用
think
tool。 - Specific examples:展示如何在不同场景下应用 instructions。
- 结合 general instructions 和 specific examples 来引导 Claude 使用
- 返回值:
- 通常返回一个简单的确认信息,例如
{"response": "Thought recorded."}
。 - 返回值的主要目的是确认思考过程已经完成,可以继续下一步操作。
- 返回值通常不包含新的信息。
- 通常返回一个简单的确认信息,例如
其他
think
tool 的函数本身可以很简单,核心在于模型在其中产生的 “思考” 内容。think
tool 会将模型的“思考”内容记录到日志中,以便开发者可以追踪模型的推理过程。
大家一起来讨论