金属矿山 ›› 2024, Vol. 53 ›› Issue (01): 174-181.
宛 鹤1 张金艳1 屈娟萍2 张崇辉1 薛季玮1 王 森1 卜显忠1
WAN He1 ZHANG Jinyan1 QU Juanping2 ZHANG Chonghui1 XUE Jiwei1 WANG Sen1 BU Xianzhong1 #br#
摘要: 针对当前矿物识别领域存在的精度不佳、适应性差、携带不便等问题,提出了一种基于改进 MobileNet V3 的矿物智能识别模型(CA-MobileNet V3)。 为获得研究所需的有效数据集,通过由 mindat. org 网站和自行拍摄方式 获取的矿物图像创建了一个包含 19 种矿物的数据集,对其进行数据增强处理,并按照 8 ∶1 ∶1 的比例划分为训练集、验 证集和测试集。 为提升模型对图像信息的特征提取能力,引入协调注意力机制,用以替代轻量型 MobileNet V3 模型的 原始 SE 注意力机制,以提高矿物识别准确率。 最后,采用迁移学习方法预训练 CA-MobileNet V3 模型,以加速模型收 敛、提高泛化能力、避免过拟合。 在训练过程中,将 CA-MobileNet V3 与 mobilenet v3、MobileNet V3、ShuffleNet V2、EfficientNet V2 等模型进行了性能比较。 结果表明:各迁移模型均展现出显著的收敛速度优势,而 CA-MobileNet V3 矿物 智能识别模型的 Top1-准确率、Top2-准确率、f1-score 值分别达到 93. 90%、98. 58%和 93. 89%,在所有模型中效果最佳, 且模型大小仅为 4. 61 MB,属于轻量化模型。 为验证模型有效性,t-SNE 可视化分析被用于不同模型的识别效果比较, 进一步印证了 CA-MobileNet V3 模型的优越性。