昆虫学报 ›› 2025, Vol. 68 ›› Issue (2): 223-230.doi: 10.16380/j.kcxb.2025.02.010
李小林1, 李建祥1, 陈彬彬1, 王荣2, 张飞萍2,3, 黄世国1,3,*
LI Xiao-Lin1, LI Jian-Xiang1, CHEN Bin-Bin1, WANG Rong2, ZHANG Fei-Ping2,3, HUANG Shi-Guo1,3,*
摘要: 【目的】针对蝴蝶样本存在类间和类内分布不平衡导致识别性能下降的问题,探索一种多损失融合的蝴蝶自动识别方法。【方法】利用开源的Butterfly-200图像数据集作为实验数据。该数据集包括200种蝴蝶,每种蝴蝶的图像数量从30~885不等。以交叉熵损失(cross-entropy loss)为基准损失,分别叠加对比损失(contrastive loss)、焦点损失(focal loss)、类平衡损失(class-balanced loss)、采样(sampling)、logit调整(logit adjustment),比较算法的识别性能。在此基础上,利用中心损失(center loss)有助于缓解类内不平衡而焦点损失有助于缓解类内和类间不平衡的特点,开展消融实验分析叠加中心损失和焦点损失对识别性能的影响,提出了融合上述这两种损失的蝴蝶自动识别新方法。【结果】交叉熵损失与其他单一损失(对比损失除外)结合时,算法的识别性能基本上呈现不同程度的下降。我们的算法在交叉熵损失基础上结合中心损失和焦点损失后,其识别性能均超过交叉熵损失及其与其他损失的组合, 准确率、 F1分值、查准率和召回率分别91.67%, 90.68%, 91.68%和90.38%。消融试验进一步证实了中心损失和焦点损失的互补性,同时使用这两种损失能明显提升识别性能。此外,不同权重的损失组合对识别性能也有明显影响。【结论】研究结果证明融合中心损失和焦点损失在一定程度上缓解了类间和类内分布不均衡的问题,能够有效提高蝴蝶识别的准确性,为生态环境监测提供了一种有效的辅助手段。