行深智能开源EdgeFM推理框架:为物流小车解锁灵魂的底层技术实践
点击下方卡片关注“自动驾驶之心”公众号戳我-领取自动驾驶近30个方向学习路线编辑 | 自动驾驶之心自动驾驶前沿信息获取→自动驾驶之心知识星球01.让具身智能在国产芯片上跑通确定性低延迟行深智能如何打破边缘AI的生态垄断在行深智能的研发基地每天都有大量自动驾驶终端与具身机器人正身处真实物理场景在真实场景中穿梭、避障、重新规划路径。它们需要实时处理视觉与语言指令并端到端地转化为连续的底盘控制动作——这正是视觉语言动作模型VLA的典型应用。然而这套“端到端感知-决策-执行”的理想范式在真正落地于资源极其受限的车载边缘平台时却长期受困于一个严酷的现实高性能推理被高度绑定的闭源硬件工具链所垄断。行深智能技术团队近日正式发布开源推理框架 EdgeFM旨在为具身智能打造一个开放、独立、可自主迭代的“移动底座”。打破生态垄断EdgeFM 以“代理驱动”的全新范式在多平台上取得了对闭源方案的显著性能优势彻底打破了算法灵魂被禁锢在特定计算躯壳中的局面。国产芯片首发适配EdgeFM 在国产地平线征程6芯片上首次完成了 VLA 模型的端到端部署让具身智能在国产算力平台上跑出了确定性的低延迟。从感知到具身行动通过将 L4 级自动驾驶沉淀的底层能力下沉EdgeFM 实现了数字大脑与物理身体的高效协同。无论是轮式、多足还是各类具身终端都能在异构硬件之上获得极致的推理效率。这标志着行深智能在构建开放、独立、可自主迭代的边缘AI部署体系上迈出了关键一步。技术报告: EdgeFM: Efficient Edge Inference for Vision-Language Models论文链接https://arxiv.org/abs/2604.27476Github: https://github.com/windog-labs/edge-fm-x02.EdgeFM为边缘控制回路而生的“薄”框架图1: EdgeFM pipeline在设计上EdgeFM完全面向物流小车这类单请求、延迟关键型负载。边缘原生极简内核去除臃肿的通用兼容层专精于边缘场景以精简C运行时与单一JSON配置文件驱动将系统开销压缩至极限。模块化技能库与代理驱动优化框架的核心创新在于利用现代AI编码代理自动搜索、调优并生成高度优化的低层级内核并封装为可复用技能。运行时通过轻量级算子分发表根据模型、硬件、输入形状及执行阶段动态热加载最优内核。开发者无需等待任何厂商的闭源实现。阶段分离与内存优化支持预填充与解码阶段分离部署。以视觉-语言-动作Vision-Language-Action, VLA模型为例感知阶段可使用高精度计算保准确性而动作解码阶段则施以激进的低比特量化与图形加速。同时内置固定前缀KV缓存复用、即插即用KV缓存压缩等机制在极端有限的内存下支撑长上下文推理。03.性能全面超越闭源工具链创造多项里程碑图2: 性能指标对比(x86, Orin, J6M)研究团队在三种典型边缘平台上对 EdgeFM 进行了严格的性能验证对比基线为 NVIDIA 官方高性能部署框架 TensorRT‑Edge‑LLM。x86 平台服务器NVIDIA A800 80GB在 Qwen2.5 系列多个 VLM 与 LLM 基座模型上EdgeFM 在绝大多数典型预填充/解码配比下均实现了更低的端到端延迟。以 Qwen2.5‑VL‑0.5B 为例1024 预填充、64 解码的配置下总延迟降低约 7.97%在更大规模模型上亦保持一致的增益趋势。资源严苛的 Orin 平台Jetson Orin NX 8GBEdgeFM 的优势被进一步放大。在 Qwen2.5‑VL‑0.5B 上框架在 512 预填充、32 解码的典型场景下实现 32.76% 的端到端延迟缩减解码阶段延迟更是大幅降低了 34.35%。整体加速比最高达到 1.49 倍充分验证了其对资源受限硬件的超强适应力。国产地平线征程 6 平台Journey 6M面对此平台通常必须依赖的闭源工具链限制EdgeFM 首次完成了VLA的端到端部署。基于 SmolVLA‑base 模型在平台原生 5 GB BPU 内存限制下通过解耦预填充‑解码计算图模型、int16 量化与轨道级校准、运算符等价替换等系统优化实现了确定性的长上下文预填充延迟和极低的动作专家解码延迟如 512 前缀下每个动作解码步骤仅约 12.5 毫秒。这标志着国产边缘芯片终于拥有了能够支撑机器人实时闭环控制的开源高性能 VLA 推理方案。04.以开放生态加速具身智能的民主化行深智能深知无人物流车L4甚至具身智能的爆发绝非单兵作战。未来的智能社会是由无数形态各异、任务不同的自动驾驶终端与机器人组成的异构网络。它们在复杂的现实空间中穿行、感知并交互这就要求底层的推理引擎必须具备跨越硬件边界、驱动多样化算法的能力。EdgeFM的开源正是面向“具身移动”时代投下的一枚种子。它不再仅仅服务于特定的物流场景而是通过内置的“代理驱动优化”范式打破了边缘计算的黑盒。任何致力于L4级自动驾驶或具身智能开发的团队都能利用AI代理生成并贡献新的内核技能——这种模块化的进化方式让全球开发者能够即时共享最前沿的移动智能成果。行深智能技术负责人表示“具身智能的灵魂在于它理解空间并进行实时决策的能力。我们不愿这种能力被禁锢在任何特定的硬件躯壳中。EdgeFM的开源是我们将L4级自动驾驶沉淀的底层能力向整个具身移动产业的一次彻底赋能。”我们邀请所有深耕边缘部署、追求极致推理效率的开发者加入EdgeFM社区。让我们不再被硬件生态所锁定共同为千行百业的智能终端打造一个真正自由、高效、感知未来的具身移动底座。自动驾驶之心求点赞求分享求喜欢