怎么理解自动驾驶技术中的agent

发布于:2025-06-15 ⋅ 阅读:(16) ⋅ 点赞:(0)
一、核心概念定义
术语 定义 典型示例
Agent 具有动态性与交互性的道路参与者,其行为需被预测并影响自车决策。 行驶车辆、行人、自行车、临时停止的出租车
静态障碍物 固定不动且无自主行为的物体,仅需几何避让,无需行为预测。 路灯、路沿、建筑物、消防栓
静止物体 当前速度为零的物体,可能是临时停止的 Agent 或真正的静态障碍物(需二次判断)。 等红灯的车辆(Agent)、倒塌的树(静态障碍物)

🔍 关键区别

  • 动态性:Agent 会运动或具有运动潜力;静态障碍物永久固定。
  • 交互性:Agent 的行为与自车存在博弈;静态障碍物只需绕行。

二、感知模块(Perception)的输出与处理
1. Detection(检测)阶段
  • 输出:场景中所有可识别物体的边界框 + 类别标签(包括 Agent、静态障碍物、背景物体)。
  • 不区分动态/静态:检测仅识别物体存在性(如“车辆”“行人”“电线杆”)。
2. 关键后续处理
步骤 功能 区分 Agent 的关键作用
分类 确认物体类别(车/人/树等) 初步筛选:车辆、行人等属于候选 Agent。
跟踪(Tracking) 跨帧关联目标,计算运动状态(速度、轨迹) 核心依据:动态物体 → Agent;静止物体 → 静态障碍物或临时 Agent。
地图融合 结合高精地图过滤已知静态物体 排除固定障碍物(如交通牌)。
结论

Detection 输出包含所有物体,但只有动态且需交互的目标被归类为 Agent


三、跟踪模块(Tracking)的输出逻辑
1. Tracking 的核心任务
  • 输入:Detection 输出的所有物体。
  • 处理
    • 为每个物体分配 唯一ID,关联连续帧中的同一目标。
    • 估计 运动状态(速度、加速度、轨迹历史)。
  • 输出所有被跟踪物体的列表(含动态 Agent、静态障碍物、临时静止物体)。
2. Tracking 输出 ≠ Agent
跟踪目标类型 是否属于 Agent? 原因
持续运动的车辆/行人 ✅ 是 动态且需交互预测。
临时静止的车辆 ✅ 是 可能随时启动(如等红灯),需行为预测。
永久静态物体(如路灯) ❌ 否 无运动能力,仅需避让几何位置。
误检背景(如飘动的塑料袋) ❌ 否 通常在后续模块过滤。
结论

Tracking 输出包含所有被跟踪目标,但仅动态且有交互需求的物体被系统标记为 Agent


四、系统级处理流程
graph TD
  A[Detection] -->|“所有物体”| B[Tracking]
  B -->|“跟踪目标列表”| C{动态性分析}
  C -->|动态物体| D[Agent]
  C -->|静态物体| E[静态障碍物]
  D -->|送入预测模块| F[行为预测 + 交互决策]
  E -->|送入规划模块| G[几何路径避让]
为何如此设计?
  • 资源优化:预测模块只需处理关键 Agent(减少算力消耗)。
  • 功能分离
    • Agent → 预测意图 + 博弈交互(如让行、超车)。
    • 静态障碍物 → 几何避障(如绕开路桩)。
  • 状态切换处理:跟踪模块持续监控“静止物体”,避免漏跟临时停止的 Agent(如车辆突然启动)。

五、总结:Agent 的最终判定条件

一个物体被系统认定为 Agent,需同时满足:

  1. 动态性:当前运动或具有潜在运动能力(如停着的车)。
  2. 交互性:其行为可能影响自车安全或效率(如行人可能横穿马路)。
  3. 跟踪持续性:在多帧中被稳定跟踪并排除误检。

静态障碍物:只需满足 → 位置固定 + 无行为意图


六、实际案例
场景 Detection 输出 Tracking 输出 最终类型 处理逻辑
行驶中的摩托车 “自行车” ID=103, 速度=30km/h Agent 预测轨迹,决策是否超车。
路边消防栓 “柱状物体” ID=205, 速度=0 静态障碍物 规划避让路径。
临时停靠的快递车 “车辆” ID=301, 速度=0 Agent 预测开车门或起步,准备刹车。
被风吹倒的广告牌 “大型物体” ID=404, 速度=0 静态障碍物 标记为临时障碍物并绕行。

结语
在自动驾驶系统中,Agent 与静态障碍物的区分本质是动态交互性与静态确定性的分离。感知与跟踪模块通过层层过滤,将原始检测目标转化为两类不同处理对象:

  • Agent → 行为预测与博弈决策的核心;
  • 静态障碍物 → 环境结构中需避让的几何实体。
    这种分层处理机制,是实现安全、高效、拟人化自动驾驶的关键基础。

网站公告

今日签到

点亮在社区的每一天
去签到