AD-DINOv3如何通过异常感知校准提升DINOv3的零样本异常检测效果?
- 内容介绍
- 文章标签
- 相关推荐
评估指标遵循零样本异常检测领域惯例,我们采用多种指标进行异常定位评估。 归根结底。 具体而言, 像素级异常定位所有领域的平均性能提供整体评估。
AD-DINOv3:零样本异常检测的
就这样吧... 论文首次将DINOv3这一强大的自监督视觉基础模型作为视觉主干网络引入到零样本异常检测(Zero-Shot Anomaly Detection, ZSAD) 领域。这为ZSAD提供了一种新的思路和强大的特征提取器。

工业图像基准测试对比
别怕... 如表2所示,我们在MVTec AD数据集上逐步解构AD-DINOv3以验证各组件贡献。基线方法直接对原始DINOv3图像块令牌进行L2归一化, 沿通道维度求平均后上采样至图像尺寸作为异常热力图,获得76.20%的AUROC和20.49%的,证实单一自监督特征无法可靠区分正常与异常区域。
| 方法 | MVTec AD | VisA | |
|---|---|---|---|
| WinCLIP | 85.6% | 79.6% | 14.8% |
| AnomalyCLIP | 90.5% | 95.4% | 28.3% |
| AD-DINOv3 | 91.6% | 95.6% | 37.7% |
实现细节实验采用Meta AI发布的ViT-L/16架构的预训练DINOv3作为默认图像编码器,文本编码器使用预训练CLIP生成文本嵌入。所有输入图像统一调整为512×512分辨率。
评估指标遵循零样本异常检测领域惯例,我们采用多种指标进行异常定位评估。 归根结底。 具体而言, 像素级异常定位所有领域的平均性能提供整体评估。
AD-DINOv3:零样本异常检测的
就这样吧... 论文首次将DINOv3这一强大的自监督视觉基础模型作为视觉主干网络引入到零样本异常检测(Zero-Shot Anomaly Detection, ZSAD) 领域。这为ZSAD提供了一种新的思路和强大的特征提取器。

工业图像基准测试对比
别怕... 如表2所示,我们在MVTec AD数据集上逐步解构AD-DINOv3以验证各组件贡献。基线方法直接对原始DINOv3图像块令牌进行L2归一化, 沿通道维度求平均后上采样至图像尺寸作为异常热力图,获得76.20%的AUROC和20.49%的,证实单一自监督特征无法可靠区分正常与异常区域。
| 方法 | MVTec AD | VisA | |
|---|---|---|---|
| WinCLIP | 85.6% | 79.6% | 14.8% |
| AnomalyCLIP | 90.5% | 95.4% | 28.3% |
| AD-DINOv3 | 91.6% | 95.6% | 37.7% |
实现细节实验采用Meta AI发布的ViT-L/16架构的预训练DINOv3作为默认图像编码器,文本编码器使用预训练CLIP生成文本嵌入。所有输入图像统一调整为512×512分辨率。

