【智能体架构:Agent】LangChain智能体类型ReAct、Self-ASK的区别

发布于:2025-03-06 ⋅ 阅读:(8) ⋅ 点赞:(0)

1. 什么是智能体

将大语言模型作为一个推理引擎。给定一个任务,
智能体自动生成完成任务所需步骤
执行相应动作(例如选择并调用工具),
直到任务完成

2. 先定义工具:Tools

  • 可以是一个函数或三方 API
  • 也可以把一个 Chain 或者 Agent 的 run()作为一个 Tool
# 需要注册 SerpAPI(限量免费),并将 SERPAPI_API_KEY 写在环境变量中
from langchain_community.utilities import SerpAPIWrapper
from langchain.tools import Tool, tool

search = SerpAPIWrapper()
tools = [
    Tool.from_function(
        func=search.run,
        name="Search",
        description="useful for when you need to answer questions about current events"
    ),
]
import calendar
import dateutil.parser as parser
from datetime import date

# 自定义工具


@tool("weekday")
def weekday(date_str: str) -> str:
    """Convert date to weekday name"""
    d = parser.parse(date_str)
    return calendar.day_name[d.weekday()]


tools += [weekday]

@toolLangChain 框架中用于快速定义 Agent 工具的核心装饰器,其作用如下:


1. 核心功能

  • 工具注册:将普通 Python 函数转化为 LangChain Agent 可调用的工具
  • 元数据生成:自动提取函数签名和文档字符串生成工具描述
  • 接口标准化:封装为符合 LangChain Tool 协议的格式

2. 代码示例解析

from langchain.tools import tool

@tool("weekday")  # 👈 关键装饰器
def weekday(date_str: str) -> str:
    """Convert date to weekday name"""  # 👈 工具描述(Agent决策依据)
    d = parser.parse(date_str)
    return calendar.day_name[d.weekday()]

3. 装饰器执行细节

阶段 操作
装饰器调用 创建 Tool 对象,将函数包装为 structured_tool.StructuredTool 实例
元数据生成 自动提取以下信息:
- 工具名称 (name="weekday")
- 功能描述(docstring)
- 参数类型(从类型注解推断)
错误处理 添加参数验证逻辑,确保输入符合 date_str: str 类型声明

4. 等价显式写法

装饰器代码等价于:

from langchain.tools import Tool

def weekday(date_str: str) -> str:
    """Convert date to weekday name"""
    d = parser.parse(date_str)
    return calendar.day_name[d.weekday()]

weekday_tool = Tool.from_function(
    name="weekday",
    description="Convert date to weekday name",
    func=weekday,
    args_schema={
        "date_str": {"type": "str", "description": "Date string"}
    }
)

5. 关键特性

特性 说明
自动描述生成 Agent 根据 docstring 判断何时调用该工具
类型安全 强制检查输入参数类型(本例中确保 date_str 为字符串)
错误反馈标准化 工具异常会被捕获并格式化为 Agent 可理解的错误消息
多工具协同 可与其他 @tool 装饰的函数组成工具集,供 Agent 智能调度

6. 调试建议

  • 查看工具元数据
    print(weekday.name)        # 输出 "weekday"
    print(weekday.description) # 输出 "Convert date to weekday name"
    print(weekday.args)        # 输出 {'date_str': {'type': 'str', 'description': 'Date string'}}
    
  • 测试工具直接调用
    print(weekday.run("2024-06-10"))  # 输出 "Monday"
    

7. 进阶用法

  • 自定义参数描述
    @tool("weekday", args_schema={"date_str": "日期字符串,格式为YYYY-MM-DD"})
    
  • 异步支持
    @tool("weekday")
    async def weekday_async(date_str: str) -> str:
        ...
    
  • 返回结构化数据
    @tool("weekday", return_direct=True)  # 直接返回原始结果不经过LLM处理
    

该装饰器极大简化了 LangChain 工具的开发流程,是构建复杂 Agent 系统的核心基础设施。

3. 智能体类型:ReAct

ReAct智能体

# !pip install google-search-results
# !pip install --upgrade langchainhub
from langchain import hub
import json

# 下载一个现有的 Prompt 模板
react_prompt = hub.pull("hwchase17/react")

print(react_prompt.template)
'''
输出:
Answer the following questions as best you can. You have access to the following tools:

{tools}

Use the following format:

Question: the input question you must answer
Thought: you should always think about what to do
Action: the action to take, should be one of [{tool_names}]
Action Input: the input to the action
Observation: the result of the action
... (this Thought/Action/Action Input/Observation can repeat N times)
Thought: I now know the final answer
Final Answer: the final answer to the original input question

Begin!

Question: {input}
Thought:{agent_scratchpad}
'''
from langchain_openai import ChatOpenAI
from langchain.agents import AgentExecutor, create_react_agent


llm = ChatOpenAI(model_name='gpt-4o', temperature=0, seed=23)

# 定义一个 agent: 需要大模型、工具集、和 Prompt 模板
agent = create_react_agent(llm, tools, react_prompt)
# 定义一个执行器:需要 agent 对象 和 工具集
agent_executor = AgentExecutor(agent=agent, tools=tools, verbose=True)

# 执行
agent_executor.invoke({"input": "2024年周杰伦的演唱会星期几"})

'''

> Entering new AgentExecutor chain...
To determine the weekday of Jay Chou's concert in 2024, I need to know the specific date of the concert. Once I have the date, I can find out the weekday. 

Action: Search
Action Input: "2024 Jay Chou concert dates"['Trending Performers · 8 events in all locations · Oct 11. Fri. 8:00 PM. This week. Singapore National Stadium. Singapore, Singapore · Oct 12. Sat. 7:30 PM.', 'Jay Chou Tour Dates See the Jay Chou concert schedule for 2024. · All Tour Dates · Oct. 11. 2024. Fri. Singapore National Stadium. Singapore, Singapore · Oct.', 'Unfortunately there are no concert dates for Jay Chou scheduled in 2024. Songkick is the first to know of new tour announcements and concert information, so if ...', 'Tour dates. edit. List of concert dates. Date, City, Country, Venue, Attendance ... ^ "Jay Chou Carnival World Tour 2024 - Singapore". Singapore Sports Hub ...', 'Jay Chou Singapore Concert 2024 Details · Jay Chou Carnival World Tour 2024 – Singapore · Date and time: 11 October 2024 (Friday) 20:00, 12-13 October 2024 ( ...', "Jay Chou is playing in Shenzhencun on Sep 12, 2024, 7:00 PM at 深圳大运中心体育场. Buy tickets, find concert information, and get ready for Jay Chou's show!", 'Concert tours ; 2019–2024, Carnival World Tour, October 17, 2019 – present ; The Carnival World Tour commenced in October 2019, and was halted by the COVID-19 ...', 'Tickets for Jay Chou Carnival World Tour Australia 2024 – Melbourne tickets will go on sale at 12pm on 26 October 2023, and Sydney tickets will go on sale at 2 ...', 'Jay Chou tickets for the upcoming concert tour are on sale at StubHub. Buy and sell your Jay Chou concert tickets today. Tickets are 100% guaranteed by ...', "'King of Mandopop' Jay Chou first to give solo concert at Taipei Dome | Taiwan News | Sep. 7, 2024 19:40."]I found that Jay Chou has a concert scheduled for October 11, 2024, which is a Friday. 

Final Answer: Jay Chou's concert on October 11, 2024, is on a Friday.
'''

输出:
{'input': '2024年周杰伦的演唱会星期几',
 'output': "Jay Chou's concert on October 11, 2024, is on a Friday."}

代码功能解析

这段代码实现了一个基于 ReAct 范式的智能问答系统,通过结合大语言模型的推理能力与外部工具调用,解决需要多步骤交互的复杂问题。以下是逐层解析:


1. 核心组件概览

# 架构图
graph TD
    A[用户输入] --> B(ReAct Agent)
    B --> C{是否需要工具}
    C -->|| D[调用工具]
    C -->|| E[直接回答]
    D --> B
    E --> F[最终响应]

2. 代码逐层解析

2.1 模型初始化
llm = ChatOpenAI(
    model_name='gpt-4o',  # 使用 GPT-4 Omni 模型
    temperature=0,        # 确定性输出
    seed=23               # 固定随机种子保证可复现性
)
  • 关键参数
    • temperature=0:禁用随机性,相同输入始终得到相同输出
    • seed=23:与 temperature 配合确保结果确定性
    • model_name:最新多模态模型,支持文本/视觉/音频混合输入
2.2 代理创建
from langchain.agents import create_react_agent

agent = create_react_agent(
    llm=llm,            # 指定大模型
    tools=tools,        # 工具集(需预先定义)
    prompt=react_prompt # ReAct 专用模板
)
  • ReAct 范式核心
    # 伪代码展示 ReAct 决策逻辑
    for _ in max_steps:
        thought = generate_thought(question, history)
        if needs_tool(thought):
            action = decide_action(thought)
            observation = use_tool(action)
        else:
            answer = generate_final_answer(thought)
            break
    
2.3 执行器配置
agent_executor = AgentExecutor(
    agent=agent, 
    tools=tools,
    verbose=True,       # 显示详细执行过程
    # handle_parsing_errors=True  # 可选错误处理
)
  • Verbose 模式输出示例
    [Thought] 需要先确定2024年周杰伦演唱会日期
    [Action] 调用演唱会日期查询工具
    [Tool Input] {"artist": "周杰伦", "year": 2024}
    [Observation] 返回日期:2024-08-15
    [Thought] 需要将2024-08-15转换为星期
    [Action] 调用日期转换工具
    [Tool Input] {"date_str": "2024-08-15"}
    [Observation] 星期四
    [Final Answer] 2024年周杰伦演唱会在星期四举行
    

3. 关键技术要点

3.1 ReAct 范式工作流程
  1. 思考 (Reason):分析问题并决定下一步行动
    {"thought": "需要先获取演唱会具体日期"}
    
  2. 行动 (Act):选择工具并生成调用参数
    {"action": "concert_date_search", "args": {"artist": "周杰伦", "year": 2024}}
    
  3. 观察 (Observe):获取工具返回结果
    {"observation": "2024-08-15"}
    
  4. 循环:重复直到得出最终答案
3.2 工具集定义要求
# 需预先定义的工具示例(假设已存在)
tools = [
    Tool(
        name="concert_date_search",
        func=get_concert_date,
        description="查询歌手演唱会日期"
    ),
    Tool(
        name="date_to_weekday",
        func=convert_to_weekday,
        description="将日期转换为星期"
    )
]
  • 命名规范:工具名称需与 Action 选择匹配
  • 参数适配:工具函数参数需与模型生成的参数一致
3.3 Prompt 模板关键内容
# react_prompt 核心片段示例
template = '''
Answer the following questions using the tools provided. 

Format instructions:
{format_instructions}

Tools:
{tools}

History:
{history}

Question: {input}
'''
  • 必须包含
    • 工具描述列表
    • 格式指令(JSON 模板)
    • 历史交互记录(多轮对话场景)

4. 执行过程示例

response = agent_executor.invoke(
    {"input": "2024年周杰伦的演唱会星期几"}
)

分步解析

  1. 初始思考
    {"thought": "需要先找到周杰伦2024年演唱会的具体日期"}
    
  2. 调用工具
    concert_date_search.run({"artist": "周杰伦", "year": 2024})
    # 返回 "2024-08-15"
    
  3. 二次思考
    {"thought": "需要将2024-08-15转换为星期"}
    
  4. 二次调用
    date_to_weekday.run({"date_str": "2024-08-15"})
    # 返回 "Thursday"
    
  5. 最终答案
    "2024年周杰伦的演唱会在星期四(8月15日)举行"
    

5. 关键配置项

参数 说明 推荐值
max_iterations 最大思考-行动循环次数 5(复杂问题可调高)
early_stopping 当模型输出 “Final Answer” 时停止 True
handle_parsing_errors 自动修复 JSON 格式错误 True(生产环境必备)

6. 性能优化建议

6.1 工具调用优化
# 为工具添加缓存(示例使用 diskcache)
from langchain.tools import tool
from diskcache import Cache

cache = Cache("tool_cache")

@tool
def concert_date_search(artist: str, year: int):
    cache_key = f"{artist}_{year}"
    if cache_key in cache:
        return cache[cache_key]
    result = api_call(...)
    cache.set(cache_key, result, expire=3600)
    return result
6.2 历史管理
# 添加对话历史支持
from langchain.memory import ConversationBufferMemory

memory = ConversationBufferMemory()
agent_executor.memory = memory

# 后续调用自动携带历史
agent_executor.invoke({"input": "那他的台北场呢?"})  # 能理解"他"指代周杰伦
6.3 异步支持
# 异步执行提升吞吐量
async def main():
    async for chunk in agent_executor.astream({"input": "..."}):
        print(chunk)

7. 典型问题排查

现象 可能原因 解决方案
无限循环 max_iterations 设置过高 设置合理阈值(如 6-8 次)
工具参数不匹配 模型生成的参数名与工具定义不一致 统一命名规范
中文输出乱码 Prompt 未指定中文响应 在 Prompt 中添加 “用中文回答”
工具调用超时 网络延迟或工具响应慢 添加超时机制

8. 应用场景扩展

  1. 客户服务

    agent_executor.invoke({"input": "我的订单#123456物流状态如何?"})
    # 需要集成订单查询工具
    
  2. 数据分析

    agent_executor.invoke({"input": "统计2023 Q3销售额最高的产品"})
    # 需要连接数据库工具
    
  3. 智能家居控制

    agent_executor.invoke({"input": "把客厅空调调到25度"})
    # 需要物联网控制工具
    

该代码展示了如何利用 ReAct 范式构建具备自主决策能力的智能系统,是开发复杂业务场景下AI助手的典型方案。通过合理配置工具集与 Prompt 模板,可快速适配不同业务需求。

4. 智能体类型:SelfAskWithSearch

# 下载一个模板
self_ask_prompt = hub.pull("hwchase17/self-ask-with-search")

print(self_ask_prompt.template)

输出:
# 下载一个模板
Question: Who lived longer, Muhammad Ali or Alan Turing?
Are follow up questions needed here: Yes.
Follow up: How old was Muhammad Ali when he died?
Intermediate answer: Muhammad Ali was 74 years old when he died.
Follow up: How old was Alan Turing when he died?
Intermediate answer: Alan Turing was 41 years old when he died.
So the final answer is: Muhammad Ali

Question: When was the founder of craigslist born?
Are follow up questions needed here: Yes.
Follow up: Who was the founder of craigslist?
Intermediate answer: Craigslist was founded by Craig Newmark.
Follow up: When was Craig Newmark born?
Intermediate answer: Craig Newmark was born on December 6, 1952.
So the final answer is: December 6, 1952

Question: Who was the maternal grandfather of George Washington?
Are follow up questions needed here: Yes.
Follow up: Who was the mother of George Washington?
Intermediate answer: The mother of George Washington was Mary Ball Washington.
Follow up: Who was the father of Mary Ball Washington?
Intermediate answer: The father of Mary Ball Washington was Joseph Ball.
So the final answer is: Joseph Ball

Question: Are both the directors of Jaws and Casino Royale from the same country?
Are follow up questions needed here: Yes.
Follow up: Who is the director of Jaws?
Intermediate answer: The director of Jaws is Steven Spielberg.
Follow up: Where is Steven Spielberg from?
Intermediate answer: The United States.
Follow up: Who is the director of Casino Royale?
Intermediate answer: The director of Casino Royale is Martin Campbell.
Follow up: Where is Martin Campbell from?
Intermediate answer: New Zealand.
So the final answer is: No

Question: {input}
Are followup questions needed here:{agent_scratchpad}
from langchain.agents import create_self_ask_with_search_agent

tools = [
    Tool(
        name="Intermediate Answer",
        func=search.run,
        description="搜素引擎",
        max_results=1
    )
]

# self_ask_with_search_agent 只能传一个名为 'Intermediate Answer' 的 tool
agent = create_self_ask_with_search_agent(llm, tools, self_ask_prompt)
agent_executor = AgentExecutor(agent=agent, tools=tools, verbose=True, handle_parsing_errors=True)

agent_executor.invoke({"input": "冯小刚的老婆演过哪些电影,用中文回答"})
> Entering new AgentExecutor chain...
是。
Follow up: 冯小刚的老婆是谁?['Feng Xiaogang is a Chinese film director, screenwriter, actor, producer and politician. He is well known in China as a highly successful commercial filmmaker whose comedy films do consistently well at the box office, although Feng has broken out from that mold by making some drama and period drama films.', 'Feng Xiaogang (冯小刚) type: Chinese film director and screenwriter.', 'Feng Xiaogang (冯小刚) entity_type: people.', 'Feng Xiaogang (冯小刚) kgmid: /m/04xhrq.', 'Feng Xiaogang (冯小刚) born: 1958 (age 66 years), Daxing District, Beijing, China.', 'Feng Xiaogang (冯小刚) awards: Golden Horse Award for Best Leading Actor.', 'Feng Xiaogang (冯小刚) children: Siyu Feng.', 'Feng Xiaogang (冯小刚) height: 5′ 10″.', '冯小刚妻子徐帆,是内地知名女演员,文艺世家出身,1991年,24岁的她毕业于央戏表演专业。当时徐帆刚和王志文分手,很是失落,于是冯小刚时常安慰和开导她,两人 ...', '冯小刚老婆徐帆和好友热聊,心情大好,面带笑容,还和朋友相拥送别。从图片看,身旁的好友是亚洲面孔。 ... 1999年,冯小刚和第一任妻子正式离婚,同年迎娶徐帆。', '徐帆是著名导演冯小刚的妻子,可以说是家喻户晓的实力派女星。值得一提的是,如今已然五十二岁的徐帆看上去依旧是靓丽又显年轻,整个人没有半分老态, ...', '尽管冯小刚和徐帆已经结婚这么多年,但他们两个人始终没有孩子。 而是一直照顾着冯小刚和前妻的女儿冯思羽,最后两个人也领养了一个女儿。', '徐帆,作为冯小刚老婆,这个女人相貌美丽,心态也非常好,对家庭非常包容,85分。冯小刚老婆85分,张艺谋老婆93分,而他的老婆我想打666分.', '冯小刚和徐帆自1991年因为《大撒把》相识,1999年结婚,相识33年结婚25年,为什么还有网友不看好他们的婚姻呢?其实细究他们的婚姻就知道,徐帆背后的付出并不 ...', '冯小刚一共有几个妻子. 2任。冯小刚一共有2任老婆2段婚姻,原配妻子是张娣。冯小刚,1958年3月18日出生于北京市大兴区,祖籍湖南省湘潭市,中国内地导演、编剧、演员。', '1. 徐帆,著名导演冯小刚的妻子,是一位才华横溢的中国女演员。2. 她于1967年8月16日出生于湖北省武汉市江汉区,1991年毕业于中央戏剧学院表演系,并加入 ...', '1999年,徐帆和冯小刚如愿以偿领证结婚,婚后的道路,其实跟前妻张娣并无二致。 慢慢成为大导演的冯小刚,身边的莺莺燕燕 ...', '冯小刚的老婆是徐帆。 徐帆1967年8月16日出生于湖北省武汉市江汉区,是中国电视、电影演员。 她与冯小刚于1999年9月19日正式结婚。 原著同样精彩,可以点击《玫瑰的故事》 ...']Could not parse output: Intermediate answer: 冯小刚的老婆是徐帆。


Follow up: 徐帆演过哪些电影?
Invalid or incomplete responseIntermediate answer: 徐帆演过的电影包括《唐山大地震》、《手机》、《一九四二》、《不见不散》等。

So the final answer is: 徐帆演过的电影包括《唐山大地震》、《手机》、《一九四二》、《不见不散》等。

> Finished chain.
输出
{'input': '冯小刚的老婆演过哪些电影,用中文回答',
 'output': '徐帆演过的电影包括《唐山大地震》、《手机》、《一九四二》、《不见不散》等。'}

代码功能解析

Self-Ask 代码实现了一个 具备自主问题拆解能力的问答系统,通过 Self-Ask(自问自答)机制结合搜索引擎,解决需要多步推理的复杂问题。以下是关键模块解析:


1. 核心技术原理

Self-Ask with Search 是一种专门处理多跳推理(multi-hop reasoning)的 Agent 模式,其工作流程如下:

用户 Self-Ask Agent 搜索引擎 复杂问题(如"冯小刚的老婆演过哪些电影") 拆解基础问题1:"冯小刚的妻子是谁?" 搜索问题1 返回答案1(徐帆) 拆解基础问题2:"徐帆演过哪些电影?" 搜索问题2 返回答案2(《唐山大地震》《甲方乙方》等) 综合答案输出最终结果 用户 Self-Ask Agent 搜索引擎

2. 代码逐层解析

2.1 工具定义
from langchain.agents import Tool

tools = [
    Tool(
        name="Intermediate Answer",  # 固定名称不可修改
        func=search.run,             # 搜索引擎执行函数
        description="搜素引擎",       # 工具描述(Agent决策依据)
        max_results=1                # 限制每次搜索返回1个结果
    )
]
  • 强制命名name 必须为 "Intermediate Answer",这是 Self-Ask 代理的硬性要求
  • 结果限制max_results=1 确保每个中间问题只取最相关结果,避免信息过载
2.2 代理创建
from langchain.agents import create_self_ask_with_search_agent

agent = create_self_ask_with_search_agent(
    llm,            # 大语言模型(如GPT-4)
    tools,          # 工具列表(必须包含Intermediate Answer)
    self_ask_prompt # 内置的专用Prompt模板
)
  • 专有架构:使用 LangChain 内置的 Self-Ask 代理结构
  • Prompt 约束self_ask_prompt 包含明确的中间问题生成指令,例如:
    Follow these steps:
    1. Break the question into sub-questions
    2. Search for each sub-question
    3. Combine the answers
    
2.3 执行器配置
agent_executor = AgentExecutor(
    agent=agent,
    tools=tools,
    verbose=True,              # 打印详细执行过程
    handle_parsing_errors=True # 自动修复JSON解析错误
)
  • 过程可视化verbose=True 时输出类似以下信息:
    [Self-Ask] 生成中间问题:冯小刚的妻子是谁?
    [Search] 使用工具 Intermediate Answer 搜索:冯小刚 妻子
    [Result] 获得答案:徐帆
    [Self-Ask] 生成中间问题:徐帆演过哪些电影
    [Search] 使用工具 Intermediate Answer 搜索:徐帆 电影作品
    [Result] 获得答案:《唐山大地震》《甲方乙方》...
    

3. 执行过程示例

response = agent_executor.invoke(
    {"input": "冯小刚的老婆演过哪些电影,用中文回答"}
)

分步解析

  1. 问题拆解
    # 模型生成的中间问题
    sub_question_1 = "冯小刚的妻子是谁?"
    sub_question_2 = "徐帆演过哪些电影?"
    
  2. 搜索调用
    search_result_1 = search.run(sub_question_1)  # 返回"徐帆"
    search_result_2 = search.run(sub_question_2)  # 返回电影列表
    
  3. 答案综合
    final_answer = "徐帆(冯小刚妻子)演过的电影包括:《唐山大地震》《甲方乙方》..."
    

4. 关键技术约束

要素 约束条件
工具名称 必须为 "Intermediate Answer",否则代理无法识别
工具数量 只能有1个工具,因为 Self-Ask 代理设计为单一搜索工具场景
Prompt 模板 需使用 LangChain 内置模板,自定义模板可能破坏 Self-Ask 逻辑
输入格式 问题必须为需要多步推理的复杂问题,简单问题可能直接调用搜索无需拆解

5. 性能优化建议

5.1 搜索引擎优化
# 提升搜索精度(示例使用 Serper API)
from langchain_community.utilities import GoogleSerperAPIWrapper

search = GoogleSerperAPIWrapper(gl="cn", hl="zh-cn")  # 指定中文结果
5.2 中间问题控制
# 在 Prompt 中添加约束(伪代码)
self_ask_prompt = """...最多拆解3个子问题..."""
5.3 结果后处理
# 添加结果清洗逻辑
def clean_search_result(query: str):
    result = search.run(query)
    return remove_html_tags(result)  # 示例:去除HTML标签

tools[0].func = clean_search_result

6. 典型问题场景

问题类型 示例 拆解步骤
多实体关联 “马云的第一任妻子的母校是哪所大学?” 1. 马云的第一任妻子是谁 → 2. 该人的母校
时间线推理 “北京奥运会那年诺贝尔文学奖得主是谁” 1. 北京奥运会年份 → 2. 该年诺贝尔文学奖得主
跨领域综合 “《三体》作者的母校最新排名多少” 1. 《三体》作者 → 2. 该人的母校 → 3. 该学校最新排名

7. 错误处理机制

7.1 解析错误应对

handle_parsing_errors=True 可自动处理以下问题:

  • 模型输出的非结构化响应
  • JSON 格式错误
  • 工具调用参数缺失
7.2 失败重试策略
# 自定义重试逻辑(需 LangChain 0.1+)
from langchain.retrievers import RetryOutputParser

agent_executor = AgentExecutor(
    ...,
    max_retries=3,
    retry_prompt=RetryPromptTemplate(...)
)

8. 应用场景扩展

  1. 知识图谱补全

    agent_executor.invoke({"input": "OpenAI CEO的母校的创办时间是多少?"})
    
  2. 事实核查系统

    agent_executor.invoke({"input": "验证以下说法:特斯拉创始人毕业于斯坦福大学"})
    
  3. 研究助手

    agent_executor.invoke({"input": "量子计算在药物研发中的最新应用案例"})
    

该代码展示了如何利用 Self-Ask 代理解决需要多步推理的复杂问题,是构建智能问答系统的有效方案,尤其适合需要事实性验证的场景。

ReAct和Self-Ask的区别以及应用场景

在LangChain框架中,ReAct和Self-ASK是两种不同的智能体类型,它们的核心设计思想和适用场景有显著差异:


1. 最显著的区别

特征 ReAct Self-ASK
核心机制 交替进行推理(Reasoning)和行动(Action),形成动态决策循环 通过自我提问(Self-Questioning)分解问题,逐层解决子问题
流程控制 推理与行动交替执行,依赖上下文动态调整 显式拆分问题为子问题,独立解决后整合答案
工具调用方式 灵活调用工具以支持当前推理步骤 每个子问题独立调用工具或搜索
适用问题复杂度 多步骤、需动态调整策略的任务 复杂问答需分解为多个明确子任务

2. 应用场景

ReAct
  • 场景特点:需要实时交互、多步骤推理且后续步骤依赖前序结果的任务。
  • 典型用例
    • 交互式任务:如客服机器人处理用户的多轮请求(如订票需先查询余票再确认支付)。
    • 动态决策:机器人导航中根据环境反馈调整路径。
    • 代码调试:通过执行代码并观察输出来逐步修正错误。
Self-ASK
  • 场景特点:问题需分解为多个独立子问题,每个子问题需外部信息支持
  • 典型用例
    • 多跳问答:例如“某公司CEO的母校是哪所?”需先查询CEO姓名,再查其教育背景。
    • 事实核查:验证复合陈述(如“某城市人口是否超过A国首都?”需分别查询两个城市数据)。
    • 复杂分析:如比较多个产品的市场表现,需逐一获取各产品数据后综合对比。

3. 选择建议

  • 选ReAct:当任务需要灵活调整策略,且步骤间存在强依赖(如后续行动依赖前一步的结果)。
  • 选Self-ASK:当问题可明确拆分为独立子问题,且每个子问题需独立检索或计算(如多源信息整合)。

示例对比

  • ReAct处理订餐请求
    推理:“用户要订素食,需过滤餐厅菜单”→ 调用菜单API → 推理:“用户偏好辣味”→ 筛选辣味素食。

  • Self-ASK回答复杂问题
    提问:“诺贝尔奖创始人是谁?”→ 搜索→“阿尔弗雷德·诺贝尔”→“他的职业?”→ 搜索→“工程师”→ 整合答案。

通过理解两者的机制差异,可更高效地设计适合业务需求的智能体。