Table of Contents

https://www.anthropic.com/engineering/claude-think-tool?ref=blog.langchain.com

相关mcp: https://smithery.ai/server/@PhillipRt/think-mcp-server

核心概念

  • “think” tool 的作用:
    • 让模型在行动(如调用工具或回复用户)前暂停并进行结构化思考。
    • 提供一个指定的空间(在模型的内部状态中)来记录和处理思考过程。
    • 帮助模型更好地理解上下文、识别潜在问题、并确保其行动符合既定策略。
  • “think” tool 与 Extended Thinking 的区别:
    • “think” tool:模型开始生成响应后,添加一个步骤来思考。
    • Extended Thinking:模型在开始生成响应之前进行的更深层次的思考和规划。
  • 思考内容的重要性:
    • 思考内容包括:对用户请求的解读、对相关规则和策略的分析、对之前工具调用结果的评估、对下一步行动的规划。
    • 思考的内容比 “think” tool 本身的功能更重要。
    • think tool 提供了一个结构化的框架,让模型能够更有效地进行推理。

使用方法

  • 提示词设计:
    • 结合 general instructions 和 specific examples 来引导 Claude 使用 think tool。
    • General instructions:告诉 Claude 何时 以及 如何 使用 think tool。
    • Specific examples:展示如何在不同场景下应用 instructions。
  • 返回值:
    • 通常返回一个简单的确认信息,例如 {"response": "Thought recorded."}
    • 返回值的主要目的是确认思考过程已经完成,可以继续下一步操作。
    • 返回值通常不包含新的信息。

其他

  • think tool 的函数本身可以很简单,核心在于模型在其中产生的 “思考” 内容。
  • think tool 会将模型的“思考”内容记录到日志中,以便开发者可以追踪模型的推理过程。
Written by

雷哥(微信:leigeaicom)

带你AI编程和AI工程化落地, 让你少走弯路, 做更有价值的创造者.

大家一起来讨论