YOLO11涨点优化:Block改进 | 融合EfficientNetV2的Fused-MBConv模块,优化浅层网络特征提取效率
一、写作动机:为什么还要折腾YOLO11?YOLO11作为Ultralytics团队在2025年持续主推的实时目标检测模型,自发布以来在COCO基准和工业落地场景中展现了极强的竞争力。其架构延续了Backbone+Neck+Head的模块化设计,并引入C3k2模块替换上一代C2f、在Backbone末端加入C2PSA注意力机制、检测头改用深度可分离卷积(Depthwise Separable Convolution)等一系列优化,使得YOLO11n在仅约260万参数的前提下达到6.6 GFLOPs的计算量,兼顾了精度与速度。根据Ultralytics官方文档及2025年6月发布的技术博客,YOLO11在Jetson Orin Nano Super上通过TensorRT加速可实现超低延迟推理,进一步拓宽了边缘部署的边界。然而,在工程实践中,YOLO11的浅层网络仍有不可忽视的优化空间。以标准YOLO11n配置文件为例,其Backbone前两个阶段仅由简单卷积层(Conv)+轻量C3k2模块堆叠,通道数从64迅速膨胀到128。这种设计固然简洁,但浅层直接使用标准卷积提取纹理、边缘等低级特征时,计算密度不高、特征表达效率有限——大量FLOPs被消耗在逐像素的空间卷积操作上,而浅层特征的判别能力并未随之线性提升。换言之,YOLO11浅层的“性价比”不够高。针对这一问题,社区出现了诸多改进思路:有研究者引入GhostConv做骨干轻量化、有人在Neck层嵌入GSConv混合卷积、还有人用CBlock(SparseViT)替换Bottleneck以增强特