注意力机制【三分钟动画讲解算法——注意力机制 | 讲透算法原理 优势】 https://www.bilibili.com/video/BV1Cm4DzqEfw/?share_sourcecopy_webvd_source0caeacd6c3217ba41c56ea47a129e168YOLO【YOLOv4原理讲解精华版(上)】 https://www.bilibili.com/video/BV1V9N4zfEw4/?share_sourcecopy_webvd_source0caeacd6c3217ba41c56ea47a129e168目标检测YOLOYou Only Look Once是一种基于深度神经网络的对象识别和定位算法其最大的特点是运行速度很快可以用于实时系统。YOLOv4 清晰分为三部分Backbone → Neck → Head1. Backbone主干CSPDarknet53作用提取图像特征线条→纹理→形状→物体改进把 YOLOv3 的 Darknet53 升级为CSPDarknet53CSP跨阶段局部连接把特征分成两路一路直接走一路走残差减少计算、增强特征、防梯度消失激活函数用Mish替代 LeakyReLU更平滑、收敛更好Ultralytics YOLOSAM 注意力加入空间注意力让模型 “看重点”2. Neck颈部SPP PAN作用多尺度特征融合—— 把 “大目标语义” 和 “小目标细节” 揉在一起两大黑科技SPP空间金字塔池化对高层特征做 4 种尺度池化扩大感受野、分离上下文特征大幅提精度PAN路径聚合网络自顶向下 自底向上双向融合让浅层细节小目标和深层语义大目标充分交流3. Head检测头作用最终预测 ——框坐标 类别 置信度延续 YOLOv3 多尺度3 个分支分别测大 / 中 / 小目标用CIoU Loss替代 IoU Loss考虑框重叠、中心距、宽高比回归更准DIoU-NMS去重框时更准减少遮挡漏检 / 误删YOLOv4 单阶段实时检测天花板2020 年 CSPDarknet53主干 SPPPAN融合 多尺度 Head预测