根据地基图像深度学习云识别外文翻译资料

 2022-12-04 02:12

英语原文共 5 页,剩余内容已隐藏,支付完成后下载完整资料


1.介绍

云在天气模式,天气预报和气象服务中扮演着重要的角色。然而,目前存在的地基云分类是由经过专业训练的观测员分析的,这导致观测员必须非常的努力,并且由于多个观测员的不同标准可能会引起歧义。因此,自动化的并且有效的云分类手段十分需要。

一些地基云图像捕获设备已经被开发出来去生成云图像。在这些设备获取图像的基础上,研究人员已经提出了许多有效的手工特征来处理地面云分类。bush和sun运用二元决策树将整个天空成像图区分成5种不同的天空状态。Singh和glen-nen利用共现和自相关矩阵来进行云分类。galbo和subburg采用傅立叶变换去区分预定义7种8气状况。heinle等人提出了几种统计特征用于预定义的7种天气情况的全自动化分类。liu等人提出了一些用于红外云图分类的云结构特征。sun等人提出了运用局部的二值模式来区分红外云图。liu等人进一步提出了云分类的显著lip。最近,dev等人提出了一种改进的基于文本的分类方法,这个方法结合了云分类的颜色和纹理信息,并在新加坡全天侯成像数据库数据集上取得了更好的性能。然而,大多数手工制作的特征具有经验参数,并且不能处理在不同照明条件下的云图像。

最近,卷积神经网络在图像分类中表现出了显著的才能。CNN有能力利用大型的标签数据集来学习越来越多杂的输入变化来获取不变量。重要的是,在这种大型数据集上预训练的CNN已经被证明可以许多其他领域形成又区别的特征表示。最近,研究人员已经将深度神经网络运用到高分辨率遥感影像中的目标检测或者土地利用分类。然而,对于云图像表示,由于云的形状是可以改变的,所以,卷积特征可能是更好的一个选择。

尽管CNN在图像分类方面已经取得了壮观的成就,但是没有一个人去评估它们对于云分类的适用性。作为一个特殊的纹理图像,云图具有其自己的特点。就云表示而言,局部的丰富的纹理信息可能要比整体的布局信息更加重要,以这个假设为基础,在这个信中,与大多数以CNN为基础的图像表示方式,即通常采用fc层和conv5特征的图像表示方法不同,我们总是更关注可以获取局地纹理信息的比较浅的卷基层,并且对浅层和深层卷积层作出一个人全面的评估。对两个具有挑战性的公共数据集进行了众多实验。实验结果证实了我们的假设,即浅层与深层相比,可以得到相似或者甚至更好的性能。

2.提议的算法

图1

图1显示了该方法的流程图。 云图像直接输入到CNN模型中; 然后利用不同的池化策略提取不同层次(卷积层或FC层)的特征,最后采用多标签线性支持向量机(SVM)模型给出分类结果。 正如我们所看到的,没有用户特定的预处理阶段和经验参数,整个流程非常简单。 在第II-A和B节中,我们将首先介绍我们所使用的深度CNN模型,然后详细介绍云图的特征表示方法。

A.深度卷积神经网络

由于大型公共图像库和高性能计算系统,CNN近来在大规模图像识别方面取得了巨大成功[16]。 Simonyan和Zisserman [23]提出通过增加更多的卷积层来稳定地增加网络的深度,导致用于大规模图像识别的非常深的CNN。 深度CNN已经在imagenet大规模视觉识别挑战(ILSVRC)分类和定位任务上取得了最新的精确度,但也适用于其他图像识别数据集。 因此,在这篇论文中,我们运用CNN模型对云图进行分类。

表1列出了我们在这篇论文中使用的两个CNN模型的配置。对于imagenet-vgg-vd-16,ConvNets的输入是一个固定大小的224times;224红绿蓝(RGB)图像。 唯一的预处理是从每个像素的训练集中减去平均RGB值。 图像通过一堆卷积层,其中使用具有非常小的接受场的滤波器:3X 3。 卷积步长固定为1个像素,卷积层输入的空间填充为1个像素。 所有的卷积层都配备了ReLU [16]用于非线性化处理。空间池是由2个像素窗口上的5个最大汇聚层进行的,步骤2是跟随一些卷积层。 卷积层后面跟着三个FC层:前两个有4096个通道,第三个执行1000路ILSVRC分类,因此包含1000个通道(每个类一个)。 最后一层是soft-max层。 对于云分类,第三FC层的通道数量取决于需要分类的云类别。

times;

times;

Imagenet-vgg-f是imagenet-vgg-vd-16的一个更简单和更快的版本,它具有较少的卷积层。 它包含五个卷积层和三个FC层。 第一卷积层的滤波器具有比imagenet-vgg-vd-16更大的感受场:11 11,并且步幅也更大:4,这使得处理输入图像更快。 三个FC层的体系结构与imagenet-vgg-vd-16相似。

原始CNN模型的训练是通过使用动量的最小批量梯度下降(基于反向传播[24])优化多项逻辑回归目标来实现的。 批量大小设置为256,动量为0.9。 训练通过体重衰减(L2惩罚乘数设置为0.0005)和前两个FC层的丢失正则化(丢失率设置为0.5)来调整。 详细的培训可以在[16]中找到。

B基于深度卷积激活的云特征

由于云具有丰富的纹理信息,因此使用纹理描述符来描述云的外观是很自然的。 滤波器组是提取纹理特征的强大工具,并且已被广泛用于纹理分析。 这些滤波器组被设计用来捕获不同尺度和方向的边缘,点和条[25]。 CNN卷积层可以被认为是深度越来越复杂的滤波器组[26]。 第一层提取边缘状特征,可以认为是滤波器组的方法,如Gabor滤波器[27]或最大响应滤波器[25]。 中间卷积和汇聚层类似于提取复杂性增加的特征的滤波器组。

对于某个卷积层,假设有C个滤波器与输入卷积,产生C个特征映射,每个映射的大小为HW。 训练每个过滤器以获得对特定类型的图案或纹理的高响应。 我们可以看到来自图2中imagenet-vgg-f的不同卷积层的若干特征地图。我们可以看到,不同的特征地图对于同一图像倾向于具有不同的激活,这意味着不同的滤波器确实被训练来描述不同的图案。 此外,来自不同类别的云图像的相同特征图的激活变化很大,这表明激活可以用作区分不同类别的特征

基于上述分析,我们使用基于卷积激活的特征来表示云。 评估两种汇集策略:汇总汇总和最大汇集。 我们针对每个特征映射采用汇总方案,其基于原始卷积激活特征的汇总。 让为来自特定特征映射fk的位置(i,j)处的卷积激活,并且映射fk的和池特征被定义为

可以通过聚合来自所有通道的fk来获取用于云图像的整体汇总DCAF(SDCAF):F f1,f2,...,fc。 然后,我们对F应用L2归一化来得到最终的表示。

同样,映射fk的最大池功能定义为

完整的最大池DCAF(MDCAF)也可通过聚合来自所有通道的fk获得:F f1,f2,...,fc。 然后F被L2归一化。

对于SDCAF和MDCAF,最终特征维度都与卷积层的通道数有关。 如表1所示,对对于imagenet-vgg-f,我们评估四个卷积层,分别为conv5,conv4,conv3和conv2,以及FC层。于imagenet-vgg-f,最后三个卷积层有256个通道,而对于imagenet-vgg-vd-16,conv4和conv5层有512个通道。

III.实验结果和分析

在本节中,我们首先介绍两个云分类数据库。 然后,我们给出实现细节。 最后,我们从两个模型的不同层面报告SDCAF和MDCAF的结果,并将我们的方法与传统方法进行比较。

A.数据库

1)SWIMCAT数据库:SWIMCAT数据库包含使用广角高分辨率天空成像系统拍摄的图像,这是一种由[28]设计的校准地基WSI。 共包含五个云类别的784个补丁,选自2013年1月至2014年5月期间在新加坡拍摄的图像。这五类包括晴空,图案云,厚厚的乌云,厚厚的白云和面纱云。 所有图像补丁都是125 125像素。 图3(a)显示了一些例子

  1. 基尔数据库:该数据库由德国基尔大学提供[11]。 数据集分为七类,包括积云,卷云,高积云,晴空,层云,层积云和积雨云。 它包含总共1500个图像,大小为2272 1704.该数据集具有较大的光照变化和组内变化。 图3(b)显示了每个类别的样本

对于这两个数据集,样本被等分为几个不相交的集,并选择每个集合作为测试集合,而其余的则构成训练集。 报告的最终识别准确度为所有测试集的平均准确度。 为了评估增加训练样本的性能,我们用2-5个不相交的分区报告结果。

  1. 实施细节

对于基于FC层的特征,它可以看作是卷积层的一个特例,其核心尺寸为1,而对于imagenet-vgg-vd-16,评估六个卷积层,从conv4-1到conv5-3和FC层。 通过双线性插值将图像标准化为224times;224,并且为每个像素减去平均RGB值。 对于所有的各种特征,LIBLINEAR [29]用于参数设置“-s 2,-c 0.5”的线性支持向量机训练和分类。为了微调模型,我们使用训练集重新训练模型并对其进行评估在测试集上。 由于SWIMCAT上的预训练模型的表现相当令人满意,因此我们只对基尔模型进行微调。 评估两组分区。 由于imagenet-vgg-vd-16在基尔上实现了更好的性能,因此我们只对imagenet-vgg-vd-16的模型进行微调。 批量大小设置为64,培训在100个时间点停止。 前40个分类的学习率设置为0.0001,其余分类的学习率设置为0.00006。 训练通过体重衰减(L2惩罚乘数设为0.0005)进行规则化。

C.结果与讨论

SWIMCAT:在SWIMCAT上使用不同图层的imagenet-vgg-f的SDCAF和MDCAF的结果列在表II中,使用imagenet-vgg-vd-16的结果如表III所示。 在每个单元格中,SDCAF的结果在顶部列出,MDCAF的结果在底部列出。 F和C分别表示“折叠”和“卷积”。 结果表明由于预训练模型是在一个完全不同的数据集上学习的,它捕获了更多的特定于领域的整体空间布局信息,而预训练模型的卷积层实现了,所以FC层的性能不如卷积层一样合理使用各种数据集分区的近乎完美的性能,分类精度达到98%以上,证明了使用预训练模型的卷积激活来描述云图像的有效性。 此外,相对较浅的层(如conv3和conv2)可以实现与较深层相当的性能,这表明低层无序纹理信息比高层空间布局更重要,以表示云图像。 比较表2和表3,我们发现imagenet-vgg-f的结果甚至可以稍微超过imagenet-vgg-vd-16的结果,这进一步意味着对于SWIMCAT,较小的模型,比如imagenet-vgg-f,就足够了来描述纹理。

2)基尔:我们列出了imagenet-vgg-f和imagenet-vgg-vd-16的SDCAF和MDCAF的结果,分别在表II和IV中分别设置了Kiel数据集。 在每个单元格中,SDCAF的结果在顶部列出,MDCAF的结果在底部列出。 结果表明,基尔的分类精度一般比SWIMCAT低很多,这就是说基尔展现出比SWIMCAT更多的挑战,如图3中的例子所示。此外,与imagenet-vgg-f和imagenet-vgg-vd-16实现类似性能的SWIMCAT不同,imagenet-vgg-vd-16在不同的图层和分区上不断超越基于imageiel-vgg-f的imagenet-vgg-f,这意味着更深层的模型,比如imagenet-vgg-vd-16,可以提取比浅层模型更有价值的模式。 各种折叠分区的结果也表明,随着培训样本的增加,性能会有所提高。

3)对模型进行微调:为了演示使用云图微调模型是否可以进一步提高性能,我们重新训练带有双重分区的预训练模型imagenet-vgg-vd-16。 由于SDCAF通常比MDCAF具有更好的性能,因此我们只需在微调后报告SDCAF的结果。 结果如图4所示。正如我们所看到的,经过微调后,性能可以进一步提高,并且当层变浅时,性能会降低。 例如,conv5-3,conv5-2和conv5-1的改进分别为5%,3%和2%,而对于比conv4-3更浅的层次,改进很小,这表明罚款调谐对于更靠近softmax层的更深层更有效,因此可以更有效地调整参数。

4)与其他方法的比较结果:我们将提出的DCAF与以下方法进行比较:1)12-D Heinle特征[11],其捕获天空/云图像的颜色,边缘和纹理信息; 2)LBP,它非常有效地描述纹理,并已用于云代表; 和3)最近提出的基于文本的方法[15],它显示了SWIMCAT的最新性能。我们用两个数据集上的(P,R)(8,1),(16,2)和(24,3)来检验LBP的结果,其中P是半径为R的圆上的采样点数并且只列出最好的(P,R)=(16,2)的结果 性能达到。 由于基于文本的方法[15]的代码没有公开可用,我们用与[15]相同的实验设置报告结果,其中随机选择40个图像用于训练,45个用于SWIMCAT测试。 我们报告50次随机运行的平均准确度。 表V显示了DCAF的结果,其中“40/45”表示SWIMCAT [15]中的设置。 对于每个细胞,SWIMCAT的结果在顶部列出,基尔在底部列出。

结果表明,所提出的DCAF在两组数据上均优于Heinle特征和LBP,并具有各种褶皱。 此外,在相同的“40/45”设置下,DCAF显示出比Heinle特征和LBP更大的优势,甚至超过最近提出的基于文本的方法[15]超过4%,证明了基于DCAF的云特征的优势与传统手工制作相比的代表性。

IV.结论

在这封信中,我们建议使用DCAF进行地基云分类。 在两个云图像数据集上的大量实验证明了使用预训练的浅卷积层的激活的适用性

用于云代表的深度CNN模型。 而且结果表明,用云图对预训练模型进行微调后,性能可以进一步提高。 比较结果显示DCAF优于传统

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[21551],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。