Table of Contents

  1. 评估测试 Ragas: LLM as judge
  2. 自我反思的 RAG
    1. 为什么你需要关注AI工程化落地?
    2. 在我的知识星球,我们不谈虚的
    3. 如果你有场景和困难, 欢迎找我聊聊AI

示例图 ![[LLM judge的洞见 2025-11-16 09.42.06.excalidraw]]

评估测试 Ragas: LLM as judge

query:

dsafdjsfklds

1 2 3

自我反思的 RAG

“自我反思”的流程:

  • 行动:先尝试一次。
  • 检查:停下来评估一下这次尝试的效果好不好。
  • 反思:如果效果不好,思考问题出在哪里,如何改进。
  • 修正:根据反思,制定一个更好的新方案。
  • 再行动:用新方案再试一次。

评分提示词 :

查询: {query}
检索结果: {results[:200]}...
相关度评分 1-5. 值返回分值

if 分值有小于3的:

查询 "{query}" 返回结果过低.
建议改善原始查询. 值返回相应的查询语句.

具体做法:

  1. 根据query-> 查询出相关片段: 10个
  2. 让模型基于这10个的相关度进行打分,比如1-5分
  3. 分数低于3的, 重写query 然后在进行检索.

为什么你需要关注AI工程化落地?

  • 如果你是一家科技公司,尤其深耕AI应用技术——工程化是把技术变为价值的关键一步。
  • 如果你来自传统行业(电商、医疗、法律、制造、金融、物流等)——AI能重构效率,但你需要懂行的人带你避开陷阱。
  • 如果你是企业决策者,关注降本增效、竞争力与创新——AI不是选修题,而是生存题。
  • 如果你是独立开发者或创业者——AI能帮你抓住机会,为企业赋能,在竞争中脱颖而出。

在我的知识星球,我们不谈虚的

我一直在一线做AI落地. 我希望这些经验可以帮到你.

欢迎加入我们,思考技术对商业的价值.

示例图

如果你有场景和困难, 欢迎找我聊聊AI

  1. 可以找AI咨询
  2. 可以找我AI落地

我的微信: leigeaicom

Written by

雷哥(微信:leigeaicom)

带你AI编程和AI工程化落地, 让你少走弯路, 做更有价值的创造者.

大家一起来讨论