在格栅灯的光学检测领域,新产品迭代速度加快与样本标注成本高的矛盾日益突出,小样本问题成为制约检测效率的关键瓶颈。传统模板匹配算法虽能实现高精度纠偏,但在新型号格栅灯样本量不足时,泛化能力显著下降。迁移学习技术通过复用已有知识,有效解决小样本场景下的模型训练难题,为格栅灯的高效缺陷检测提供了全新解决方案。

 

一、
迁移学习解决小样本问题的算法原理

迁移学习的核心是通过知识迁移打破小样本场景下“数据稀疏”的限制,其本质是利用源域(已有充足样本的旧型号格栅灯数据)与目标域(小样本的新型号格栅灯数据)的相似性,将源域的模型参数、特征表示等知识迁移至目标域,实现小样本下的高精度检测。

(一)核心概念与数学定义

  • 域与任务的数学描述

源域:1.png:包含旧型号格栅灯的光学图像集2.png及数据分布3.png

目标域:4.png:包含新型号格栅灯的光学图像集5.png及数据分布6.png

任务:7.png:Y为标签集(如缺陷类型、亮度值),8.png为预测函数。迁移学习的目标是在9.png10.png时,利用DS和TS优化11.png(目标域预测函数)。

  • 迁移学习的数学模型

设源域模型为12.png(θS为模型参数),目标域模型为13.png。迁移学习通过约束θT与θS的相似度实现知识复用,数学表达为:

14.png

其中,LT为目标域的损失函数(如交叉熵损失),15.png为参数距离度量(如欧氏距离),λ为平衡因子(控制迁移强度,通常取 0.01~0.1)。

(二)小样本迁移的关键算法

  • 参数迁移算法

适用于源域与目标域特征分布相似的场景,通过微调源域模型参数实现迁移。对于格栅灯缺陷检测,源域模型已学习到 “格栅结构、光斑分布、常见缺陷特征” 等通用知识,可固定底层参数(如卷积层权重),仅微调顶层参数适配目标域:16.png

其中,θ'S为源域模型的冻结参数(如前3层卷积核),△θ为目标域数据训练的微调量(通过梯度下降求解)。通过源域数据学习通用特征映射函数17.png,将目标域数据映射至该特征空间,再用小样本训练分类器。对于格栅灯的缺陷检测,特征映射函数可表示为:18.png

其中,19.png为卷积操作(ω为源域训练的卷积核),20.png为池化操作,通过该映射可提取格栅灯的边缘、缺陷轮廓、亮度梯度等鲁棒特征。针对源域与目标域分布差异,通过最小化分布距离实现迁移。常用的最大均值差异(MMD)度量两域分布差异:21.png

其中,22.png为再生核希尔伯特空间,17.png为核映射函数(如高斯核)。通过在损失函数中加入MMD约束,可使目标域特征分布逼近源域:

23.png(γ为分布对齐系数,通常取0.05~0.2)

二、
基于迁移学习的格栅灯小样本缺陷检测流程

以 “新型格栅灯的光斑偏移、灯罩裂纹等缺陷检测” 为例(目标域样本量仅80张),说明迁移学习在小样本场景下的应用步骤。

(一)数据预处理与源域模型构建

  • 数据预处理

源域数据:收集5000张旧型号格栅灯的光学图像(含正常样本及光斑偏移、裂纹、污渍等缺陷样本),经灰度化(减少计算量)、高斯滤波(5×5核去除噪声)、直方图均衡化(增强缺陷对比度)处理后,标注缺陷类型标签24.png(0-正常,1-亮斑,2-暗斑)。

40.png

目标域数据:80张新型号格栅灯图像(同预处理方法),标注标签25.png,并通过旋转(±15°)、缩放(0.8-1.2倍)、光照扰动(亮度 ±20%)等数据增强手段扩充至240张。

41.png

  • 源域模型训练

构建基于CNN的缺陷检测模型fS,网络结构包括4个卷积层(提取缺陷特征)、2个池化层(降维)和2个全连接层(输出缺陷类别概率),损失函数为交叉熵损失:26.png

其中,27.png为标签(1表示第c类缺陷,0否则),28.png为模型预测的第c类概率。训练至源域验证集准确率达95%,保存模型参数θS
(二)知识迁移与目标域模型训练

  • 参数迁移与微调

冻结源域模型的前2个卷积层参数(保留格栅结构、基础缺陷特征的提取能力),替换顶层全连接层为新网络(适应目标域缺陷类别)。

用目标域数据训练微调模型,损失函数为:29.png 。其中,λ=0.05(平衡参数),通过Adam优化器(学习率 0.0001)求解θT

  • 分布对齐优化

计算源域与目标域的特征分布差异,用MMD约束优化模型:30.png。其中,31.png为模型第3层卷积输出的特征向量,γ=0.08,通过该约束减少两域因型号差异导致的分布偏移。

(三)模型评估与检测实现

  • 评估指标

 缺陷检测准确率:31-1.png
缺陷召回率:32.png(衡量漏检率)。
模型收敛速度:达到目标准确率(>90%)所需的迭代次数。

  • 检测流程

输入新型格栅灯图像,经预处理(灰度化、滤波)后通过特征映射函数17.png提取特征。

42.png

目标域模型输出缺陷类别及置信度,结合模板匹配的纠偏结果,定位缺陷位置并计算缺陷严重程度参数(如亮暗斑大小形状)。

三、
算法优势与实验验证

(一)解决小样本问题的核心优势

  • 样本效率显著提升

在目标域样本量仅为源域1.6%的情况下,迁移学习模型的缺陷检测准确率比从零训练的模型提升 42%(从58%升至82%),无需大量标注即可实现高精度检测。

43.png 

  • 泛化能力增强

通过领域自适应,模型对不同型号格栅灯的结构差异(如格栅间距、灯珠排列)的适应能力提升,检测准确率标准差从±5.3% 降至±2.1%。

  • 部署成本降低

 迁移学习模型的训练时间仅为传统模型的1/4,且无需重新设计特征提取网络,新型号格栅灯的检测系统部署周期从7天缩短至2天。

(二)实验数据对比

wechat_2025-07-24_192559_058.png

四、
结论与应用前景

迁移学习通过知识复用有效解决了格栅灯小样本缺陷检测的难题,其核心在于通过参数迁移、特征映射和分布对齐,在样本量有限的情况下实现高精度检测。实验表明,该算法在新型号格栅灯的光学缺陷检测中,准确率可达82%以上,且训练效率提升4 倍,为格栅灯的快速迭代检测提供了技术支撑。

随着深度学习技术的发展,未来可结合注意力机制实现动态特征迁移(聚焦关键缺陷区域),或融合元学习进一步提升极小样本(<30张)场景的检测性能,推动光学检测向低成本、高效率、高适应性方向发展。

 

关于我们

上海光色智能科技有限公司是一家致力于汽车发光部件行业,研究和生产光色精准检测、校准系统智能装备的科技型公司。是产业链中细分领域的头部梯队,被认定为“高新技术企业” 和“专精特新”企业。

艾邦创建了数字格栅交流群,目前已有一汽、上汽、敏实、麦格纳、江阴道达、宁波四维尔、延锋彼欧、一汽富晟、华域视觉、曼德光电、现代摩比斯、麦格纳、法雷奥、佛吉亚/海拉、彼欧、马瑞利等发光格栅产业链的上下游企业加入,欢迎各位朋友入群探讨,共谋进步。