玩转OurBMC第二十六期:OpenBMC固件远程更新原理与实践(下)
栏目介绍“玩转OurBMC” 是OurBMC社区开创的知识分享类栏目主要聚焦于社区和BMC全栈技术相关基础知识的分享全方位涵盖了从理论原理到实践操作的知识传递。OurBMC社区将通过 “玩转OurBMC” 栏目帮助开发者们深入了解到社区文化、理念及特色增进开发者对BMC全栈技术的理解。欢迎各位关注 “玩转OurBMC” 栏目共同探索OurBMC社区的精彩世界。同时我们诚挚地邀请各位开发者向 “玩转OurBMC” 栏目投稿共同学习进步将栏目打造成为汇聚智慧、激发创意的知识园地。在上期内容中我们深入剖析了OpenBMC完成固件更新的底层机制无论是BMC自身的单分区或A/B分区更新还是通过接管SPI、JTAG总线对BIOS、CPLD进行的烧录其本质都是直接执行底层的更新命令。然而在生产环境中管理员并不会手动执行这些底层命令。取而代之的是通过Web界面或Redfish接口发起的远程升级流程。本期我们将聚焦于phosphor-bmc-code-mgmt 软件栈系统性解析从用户发起更新操作到固件最终写入芯片的完整软件协作流程展示 OpenBMC 如何通过分层、事件驱动的架构将高风险的固件更新流程封装为安全、可控、可审计的标准化服务。01核心架构分层与事件驱动的设计协议与策略层 (bmcweb)负责实现 Redfish 标准接口将 HTTP 请求转换为 D-Bus 操作并决定更新的执行策略如“立即激活”。管理层phosphor-software-manager内部核心协调组件ItemUpdater作为核心守护进程负责软件对象的生命周期管理、全局状态维护以及系统级策略的执行。业务逻辑层 (Activation)作为自主状态机封装了从校验到写入的完整业务流程。执行层 (Systemd Services)服务中调用脚本脚本中封装与具体固件类型相关的更新命令是软件与硬件交互的最终边界。一次典型的更新流程由一系列事件驱动的模块交互构成。各模块通过发布与订阅D-Bus信号、设置与监听属性变化来协同工作形成一个松耦合但衔接紧密的自动化工作流。下图以 OpenBMC 默认的“上传后立即激活”策略为例重点展示控制流与事件触发关系而非所有异常分支。流程关键点解析如下自动激活策略步骤5和6是默认行为的关键。bmcweb 在监听到新 Activation 对象创建的信号后其 softwareInterfaceAdded 回调函数会自动调用 activateImage() 来触发激活。该策略通过事件驱动机制将用户的单次上传操作自动衔接至激活流程实现上传-激活的无缝衔接。架构的灵活性上述“自动激活”策略并非强制。产品可以通过修改 bmcweb 的回调逻辑将其变为“手动激活”即在界面上提供独立的激活按钮。这验证了架构的松耦合特性——只要最终通过标准 D-Bus 接口设置 Activation 的属性就能驱动整个流程。状态机的自主性从步骤7开始Activation 对象进入完全自主的状态流转它根据需要调用 ItemUpdater 提供的策略工具并最终驱动 Systemd 服务是执行业务流程的核心实体。02模块深度解析各司其职的精密协作bmcwebRedfish协议实现与更新请求的转换层作为 Redfish 协议的服务端实现bmcweb 是远程更新流程的入口。它负责接收标准化的HTTP(S)请求并将其翻译为对底层 D-Bus 服务的调用。它提供两种主要的镜像上传接口简单上传接收二进制镜像文件如tar.gz。多功能上传支持在请求中嵌入结构化参数如目标固件类型 Targets、更新生效时间 ApplyTime。其核心策略逻辑体现在 softwareInterfaceAdded 函数中。该函数通过 D-Bus 信号监听新 Activation 对象的创建一旦发现便根据产品预设的策略决定是否立即激活。这正是 “上传后是否自动激活”这一产品行为的策略执行点充分体现了 bmcweb 作为协议层与产品策略执行层的角色。在OurBMC社区中采用的是HTTP Push但引入了BMC更新生效时间 ApplyTime参数使得管理员在网页更新BMC固件时可以选择是否勾选该参数从而在全部流程以后走完后自动重启或者下次手动重启。ImageManager 镜像入库管理ImageManager 负责将原始固件包转化为系统可管理的对象。它本身不主动扫描而是由内置的 Watch 模块通过 Linux inotify 监听上传目录/tmp/images。当文件完全写入后Watch 触发 ImageManager::processImage()依次执行解包、解析 MANIFEST 文件获取固件用途 purpose、版本 version 等、机型校验最终在 D-Bus 上创建一个状态为 Ready 的 Version 对象并发出 InterfacesAdded 信号完成“入库”。ItemUpdater全局状态管理与策略执行ItemUpdater 是更新系统的核心管理组件但它不直接驱动更新流程。它的核心职责包括对象生命周期管理监听 ImageManager 的信号为每个新 Version 创建并关联对应的 Activation 对象维护全局的对象映射表。维护系统状态关联通过 D-Bus Association 机制管理 functional当前运行的版本和 active下次启动的版本等关键关系。BMC管理界面基于此来查询运行中固件和备用固件的状态。执行系统级策略它提供的 freeSpace()清理空间、savePriority()保存启动优先级等方法并非更新流程的发起者而是被 Activation 状态机在运行过程中回调使用的“策略工具”。ImageManager 的职责在 Version 对象创建完成后即告结束它不参与任何激活或刷写逻辑。Activation自主运行的状态机每个 Activation 对象都是一个自包含的有限状态机Ready - Activating - Active/Failed。它是更新流程的真正执行核心其设计精髓在于自主性由属性触发当 bmcweb 或其他授权服务设置 RequestedActivation 属性后Activation 状态机开始按既定逻辑流转。自主决策与协调在 Activating 状态中它自主进行安全校验签名验证、最小版本限制 MSL并根据自身的 purpose 属性决定调用哪个底层 systemd 刷写服务。在此过程中它会根据需要调用 ItemUpdater 的策略工具。自主完成监听 systemd 服务的回调并自主更新最终状态再通知 ItemUpdater 刷新全局关联。至此Activation 的职责边界结束后续执行完全由 systemd 服务及其脚本接管。Systemd 服务硬件操作的最终执行层这是与上篇硬件操作对接的最后一环。Activation 通过封装好的 D-Bus 接口触发对应的 systemd 服务如 obmc-flash-bios.service。该过程并非直接执行底层刷写命令而是由 systemd 单元负责启动脚本脚本中再封装与具体固件类型相关的更新命令从而实现上层状态机与具体刷写实现细节之间的清晰隔离。03总结通过对完整流程的剖析我们可以看到OpenBMC 固件更新架构呈现出的清晰层次层级核心模块职责关键交互协议/策略层bmcweb实现Redfish 协议转换用户意图执行产品更新策略如自动激活。监听D-Bus 信号设置 Activation 属性。管理层phosphor-software-manager以 ItemUpdater 为核心的管理组件全局对象与状态管理提供系统级策略工具。创建对象维护关联被Activation 回调。业务逻辑层Activation封装完整的更新业务流程是自主驱动的状态机。被属性触发协调校验、调用服务、更新状态。执行层Systemd服务封装具体的硬件操作命令与硬件直接交互。被Activation 启动反馈执行结果。这种架构的优势在于高度的模块化与解耦任意一层只要遵循约定接口便可独立替换或升级。例如改变bmcweb 的信号处理逻辑即可将“自动激活”改为“手动确认”增加新的 systemd 服务便能支持新的固件类型而整个核心状态机和管理框架无需改动。最终这一套从用户界面到固件刷写命令的协同机制将复杂且高风险的固件更新操作转化为一个安全、可观测、可审计的标准化服务。正是这种模块化、事件驱动的架构设计使OpenBMC 能够在保证系统安全性的前提下将固件更新纳入大规模数据中心的自动化运维体系之中。欢迎大家关注OurBMC社区了解更多BMC技术干货。OurBMC社区官方网站https://www.ourbmc.cn/