叶大鹏, 景均, 张之得, 李辉煌, 吴昊宇, 谢立敏
【目的/意义】 为了解决图像尺寸变化和目标尺度变换共存对小目标检测精度的影响问题,本研究提出了一种新的检测模型:Multi-Strategy Handling YOLOv8(MSH-YOLOv8)。 【方法】 该模型在YOLOv8的基础上增加一个检测头,以提高小尺度目标敏感度;引入Swin Transformer的检测结构到头部网络,以减少计算冗余;引入包含可变形卷积的C2f_Deformable Convolutionv4(C2f_DCNv4)结构和Swin Transformer编码器结构重构YOLOv8主干网络,优化并增强其特征传递和提取能力,提高小目标敏感度;采用基于规范化的注意力模块(Normalization-based Attention Module, NAM)优化网络检测速度和准确性;用Wise-Intersection over Union Loss(WIoU)代替原损失函数,以提高训练效果和收敛速度;在后处理阶段应用分辨率动态训练、多尺度测试、软非极大值抑制算法(Soft-Non-Maximum Suppression, Soft-NMS)、加权边界框融合算法(Weighted Boxes Fusion, WBF)等方法,提高尺度变化下小目标检测效果。以蘑菇为研究对象,在开放数据集Fungi上开展实验。 【结果和讨论】 MSH-YOLOv8的平均正确率(Average Precision50, AP50)和AP@50-95分别达到了98.49%和75.29%,其中小目标检测指标值APs达39.73%。相较于主流模型YOLOv8,三项指标分别提高了2.34%,4.06%和8.55%;相较于优秀模型Transformer Prediction Heads-YOLOv5(TPH-YOLOv5),三项指标分别提高了2.14%,2.76%和6.89%。 【结论】 本研究提出的MSH-YOLOv8改进方法可在图像尺寸变化与目标尺度变化条件下有效提高小目标的检测效果。