TR-C丨东南大学TRIP：智能交通大模型基础框架研究

张

张建站

2026/5/23 15:20:06

10分钟阅读

导读智能交通系统正从 “数据驱动” 迈向 “认知智能”但长期面临物理规律与语义知识割裂、大模型易违背交通规则、决策难以分层协同三大痛点。东南大学交通学院团队在交通领域顶刊Transportation Research Part C发表重要成果原创提出TRIPTransport Reasoning with Intelligence Progression 框架首次用双状态空间理论统一交通物理建模与语义理解实现像人类专家一样的渐进式推理决策为智能交通大模型落地提供全新理论与技术路径。1基本信息期刊Transportation Research Part C: Emerging TechnologiesTOP 期刊影响因子7.9标题TRIP: Transport reasoning with intelligence progression - A foundation framework作者Zhiyuan Liu, Zhen Zhou, Ziyuan Gu, Shaoweihua Liu, Pan Liu, Yujie Zhang, Yiliu He, Kangyu Zhang团队东南大学城市智能交通江苏省重点实验室、浙江交投全球科技研究院关键词智能交通、大语言模型、世界模型、双状态空间、渐进式推理、分层强化学习发表时间2025 年 7 月在线出版2核心创新点首次提出交通系统双状态空间理论将交通状态统一解构为物理状态空间与语义状态空间通过可学习映射实现双向、Lipschitz 连续对齐。提出跨模态对齐机制打通数据驱动与知识驱动范式实现物理模式与语义事件的相互解释解决表征不完整问题。构建渐进式推理决策路径模仿人类专家决策从语义理解→物理预测→行动执行实现分层决策与全局优化。可扩展双状态空间建模支持长序列高效处理具备稳定性、鲁棒性、有界性理论保证。统一物理智能与语义智能为实时、可解释、自适应的智能交通系统提供理论基础。3论文摘要智能交通系统的快速发展面临诸多重大挑战包括交通状态表征不完整、多源异构知识融合效果不佳以及分层决策优化困难。传统方法通常将物理动力学与语义上下文相割裂导致推理碎片化与控制策略次优。为解决这些不足本文提出TRIP智能渐进式交通推理框架—— 一种基于双状态空间理论的全新框架。TRIP 将交通系统状态分解为物理状态空间与语义状态空间两者通过可学习映射实现互联并确保双向的利普希茨连续对齐。依托大语言模型与世界模型的技术进展TRIP 采用分层强化学习方法实现渐进式推理通过从语义理解过渡到物理预测与行动执行模拟人类专家的决策逻辑。其核心创新包括实现跨模态对齐以打通数据驱动与知识驱动范式、采用可扩展的双状态空间建模以高效处理长序列、为系统稳定性与鲁棒性提供理论保障。通过统一物理智能与语义智能TRIP 为可解释、实时性的交通系统奠定理论基础使其能够在复杂动态环境中运行并兼顾全局优化与局部约束。本研究填补了智能交通领域的关键空白为构建自适应、以人为本的城市出行解决方案提供了可行路径。4研究动机传统 ITS 三大核心局限仅关注速度、流量等物理数据忽略交通事件、规则等语义信息状态表征不完整。缺乏多源异构知识有效融合机制领域知识与数据模型脱节。难以实现跨时空尺度分层决策宏观策略与微观操作难以协同。大语言模型LLMs应用局限语义理解能力强但在复杂交互环境中对物理动态理解有限约 30% 控制决策违反物理规律推理延迟高难以满足实时控制要求。世界模型应用局限物理建模精准但高层知识理解能力弱、训练成本高、泛化有限。核心科学问题交通领域缺少统一物理建模与语义理解的基础理论框架无法支撑安全、可靠、可解释的认知智能。5研究方法双状态空间理论构建物理状态空间车辆位置、速度、加速度、路段流量、密度等可观测连续欧氏向量空间。语义状态空间交通事件、路况描述、交通规则、管控策略等离散有限集合。双状态空间统一固定维向量空间通过物理映射与语义映射实现双向嵌入满足唯一性、Lipschitz 连续性、跨模态一致性、可判别性、可解释性。渐进式推理与决策理论基于马尔可夫决策过程扩展将双状态纳入决策流程实现收敛性保证、扰动鲁棒性、状态与行动有界性。关键技术实现语义状态映射基于 LLM 实现结构化语义解析、特征提取与空间映射。物理状态映射基于分层世界模型微观车辆宏观交通流实现动态建模与预测。双空间对齐优化实例级 / 语义级 / 分布级三级对齐结合对比学习与动态一致性约束。分层协同决策宏观语义策略→中观双状态控制→微观物理执行三级强化学习。LLM 与 MDP 融合的 5 种策略概率选择策略、MDP 从 LLM 生成动作集中选择、LLM 审核 / 否决 MDP 动作、LLM 作为 Actor-Critic 第二评论家、LLM 生成宏观动作→MDP 精细化执行。6实验结果实验基于SUMO 交通仿真平台完成验证两大场景交通信号控制采用 DeepSeek-R1-7B LLM 与 DQN 强化学习混合决策90% RL 10% LLM。TRIP 较基线方法显著降低路网平均等待时间。收敛更快、波动更小后期稳定维持更低等待时间。动态路径规划采用 50% 概率混合 LLM 建议与 RL 策略。TRIP 训练损失显著低于基线收敛更稳定。最终损失较基线降低约 60%长期鲁棒性更强。融合优先经验回放、Double Q-Learning、GNN 与注意力机制提升规划精度。核心结论TRIP 在控制效率、收敛速度、稳定性、物理合规性上全面优于传统方法具备实际部署潜力。7未来展望大规模路网验证在大型仿真路网与真实城市路网中开展实验验证规模化性能与计算效率。鲁棒信息传递机制针对噪声、缺失数据开发跨尺度聚合 / 解聚函数提升双空间一致性。轻量化与实时部署采用 7B 级轻量 LLM结合边缘计算、分布式计算降低推理延迟。多智能体与多目标扩展扩展至多车辆协同、多目标优化效率、安全、低碳。理论与工程完善完善可解释性、不确定性量化、误差传播校正推动工程落地。期待你的分享点赞在看欢迎关注微信公众号《当交通遇上机器学习》如果你和我一样是轨道交通、道路交通、城市规划相关领域的也可以加微信Dr_JinleiZhang备注“进群”加入交通大数据交流群希望我们共同进步· 往期推荐交通顶刊TR Part C 2026年5月论文导读上交通顶刊TR Part C 2026年5月论文导读下IEEE TNNLS 2025丨标签只有 0.4% 也能 SOTA东南大学 USemiS 破解少样本时空异常检测难题团队研究成果Metrica A 2025基于多任务学习的大型语言模型高速铁路客流预测团队研究成果 | Transportation 2025: 基于时空多任务学习的节假日期间城市轨道交通短时进出站客流预测