昆虫学报 ›› 2024, Vol. 67 ›› Issue (9): 1251-1261.doi: 10.16380/j.kcxb.2024.09.009
李建祥1, 李小林1, 王荣2, 张元孜1, 陈淑武1, 张飞萍2,3, 黄世国1,3,*
LI Jian-Xiang1, LI Xiao-Lin1, WANG Rong2, ZHANG Yuan-Zi1, CHEN Shu-Wu1, ZHANG Fei-Ping2,3, HUANG Shi-Guo1,3,*
摘要: 【目的】准确鉴别蝴蝶种类,动态观测蝴蝶群落多样性变化对生境质量评估、生态环境恢复等方面具有重要意义。针对现有蝴蝶识别方法仅依靠整体特征,忽略了局部特征导致识别生态图像能力不足的问题,本研究旨在开发一种Local-Global-VIT细粒度分类算法的蝴蝶识别方法。【方法】本研究以5科200种共计25 279张蝴蝶图像为识别对象,采用多种数据增强方法扩充图像数据;通过视觉Transformer(vision transformer, VIT)层级结构及自注意力机制逐层选择局部令牌并保留至最后一层学习蝴蝶局部判别部位信息;聚合高层全局令牌消除复杂背景干扰;通过对比损失拉大类间距提高区分度。除此之外,使用合理的学习率调整策略和迁移学习方法,优化了模型收敛过程,在不增加参数量的情况下提高了性能。【结果】 Local-Global-VIT算法在大规模细粒度公开数据集Butterfly-200上识别准确率达91.20%,较改进前提升了1.15%,比最优的一般害虫识别算法EfficientNet_b0和细粒度分类算法TransFG准确率分别高了1.83%和0.64%, F1分值分别提高了1.89%和0.88%。【结论】Local-Global-VIT算法以细粒度识别方式有效解决了蝴蝶类内差异大、类间差异小的分类难题,能准确地识别蝴蝶种类,有助于高效评估生境质量。