端到端决策控制(End-to-End Control)
1. 传统模块化控制链(Modular pipeline)
image
→ perception(感知)
→ state estimation(状态估计)
→ planning(路径/动作规划)
→ control(控制器)
→ motor torque / actuator(执行)
特点:
- 每一步有明确物理意义
- 可解释性强,可单独调试
- 但存在误差累积、延迟、模块间信息损失
典型例:
image → lane detection → path planning → steering controller
image → SLAM → map & speed
2. 机器人经典控制链(基于模型)
image
→ VLA / perception
→ Δpose(末端位姿增量)
→ Jacobian
→ Δq(关节角增量)
→ motor
本质: task space → joint space → actuator
依赖:
- 几何模型
- 运动学 / 动力学
- 控制理论
3. 端到端控制(End-to-End)
image
→ neural network
→ joint torque / action
或:
image
→ neural network
→ steering / control signal
特点:
-
直接学习:
observation → action
-
不显式建模:
perception / planning / control
全部隐含在网络中
4. 核心思想对比
模块化:
image
→ perception
→ planning
→ control
→ action
端到端:
image
→ neural network
→ action
5. 优势与问题
优势:
- 减少人为建模误差
- 避免模块间信息损失
- 可直接优化最终目标
问题:
- 可解释性弱
- 数据需求极大
- 泛化困难
- 安全性难保证
6. 本质理解(一句话)
传统:
显式分解任务空间 → 控制空间
端到端:
直接学习
observation → control mapping