一种基于关联频率模式的机械故障诊断的数据挖掘方法外文翻译资料

 2022-04-14 09:04

英语原文共 14 页,剩余内容已隐藏,支付完成后下载完整资料


一种基于关联频率模式的机械故障诊断的数据挖掘方法

Md.MAmunur Rashid,Muhammed Amar,Iqbal Gondal,Joarder Kamruzzaman

Published online: 13 April 2016

copy;Springer Science Business Media New YorK 2016

摘要:轴承在旋转机械中非常关键并且轴承的失效是旋转机械破坏的重要原因之一。它们的性能与旋转机械的运行状况、服役寿命和工作效率都有直接的关联。因此,轴承故障识别是具有非常重要的意义的,而现在的故障诊断和异常检测技术的准确性还不足够。我们提出一种利用机械振动数据,基于数据挖据的故障识别和异常检测的结构。在这个结构里,为了从振动数据流里提取出有用信息(VDS),我们利用快速傅里叶变换(FFT)来对数据进行预处理以提取频率特征,然后构建一个称为SAFP-tree简洁树(关联频率模式树),并且提出SAFP挖掘算法。SAFP挖掘算法可以在振动数据流的当下窗内挖掘关联频率模式(如故障频率特征)然后利用它们去识别轴承数据里的故障。最终来说,SAFP算法因其判定了被提取频率特征正常表现衡量指标(NBM),是对用于异常检测的SAFP-AD算法的更深入的加强。结果表明,我们的技术在对振动数据流的故障识别与异常检测上十分有效,并且可以用于远程机械健康诊断。

关键词:机械状态监控(MCM)、轴承故障、异常检测、关联频率模式树、振动数据

1 介绍

在国内和工业应用的大部分旋转机械中,轴承是重要的组成部分。其故障可能产生机械噪声并且会降低生产线质量,甚至可能导致机械灾难性破坏。有接近41%的整体机械故障是轴承造成的。大部分轴承故障的发生是因为内滚道,外滚道或球轴承存在缺陷。

许多可以用在轴承健康监测的机械状态监测技术是以对磨屑、电机电流、噪声、温度、振动信号等的分析为基础的。在这些中,振动分析因其可靠性与对故障严重程度的敏感性是目前最为有效的技术。因为不遵守规范或者出现缺陷,轴承成为一个振动噪声源。能够提供关于轴承健康信息的振动信号是在滚动部分里产生的,并且可以通过传感器进行信号记录。每一种不同类型的故障所造成的振动会产生特定的频率成分,这是轴承几何形状与运行速度作用的结果。轴承内圈、外圈、和滚动体的故障振动频率都可以用一下表达式进行计算。

式中出现的代号代表着转动频率,分度圆直径,滚球直径,滚球个数和接触角,如图一所示

图一 球轴承滚动部分几何示意图

振动分析技术通常包括时域、频域或时频域分析。在时间域中,识别每个独立振动源是很困难的。因此,识别机械振动中的的每一个异常是十分低效的。因为在实际情况中,振动信号都是非平稳的,也即是说,其频谱成分会随时间而变化,所以频率分析是最流行的方法,其可以利用快速傅里叶变换(FFT)将时域振动信号转变为离散频域成分。频域分析的主要优点是其能够方便的检测并识别出特定频率分量的幅值,并因此能够更容易的与独立振动源相关联。发生在轴承里的故障能够导致与轴承特征频率相关联的频率的振动强度加大,使得在更早期就可以检测出故障。

频域分析能够从振动数据中提取故障特征,然后应用一种机器学习方法将故障特征与健康特征区别开来。现在的故障诊断技术关注于以可获取的故障案例为基础进行的故障分类。但是,总的来说,因为故障的发生是偶然的并且每种类型的故障都有其独有的故障振动模式,从轴承缺陷中收集所有类型的故障数据是非常困难的。模式分类技术被用于攻克这些难题。但是,大部分这些技术都面临着挑战,包括模式识别,正交权重估计(ANN)和大数据量的计算。更重要的是,当新的未知的故障出现时,分类技术会某时无法识别故障或其类型。因此,需要一种更优越的技术去从振动数据中识别故障或异常。这篇论文的重点就是提出了一项新技术来解决这些局限性。

在这篇论文里,抱着设计比现存技术更优越的故障与异常检测方法的目的,我们提出了一种基于数据挖掘的结构,从转动体振动数据中去挖掘关联频率模式,然后利用其去识别故障频率。因其输出是仅仅以支持阈为基础的,频率模式挖掘技术并不适合在模式中挖掘“兴趣”。频率模式挖掘技术依赖于一个表明最小支持度的约束,其确定了结果频率模式可信度的最小下界。如果最小支持度被设置的高,我们就可以以相对较少量的模式去提取高价值信息。反过来说,当最小支持度很低时,会产生极大量的模式,并且其中大部分都是非信息。在这种情况下,数据对象的有效关联就会被埋没在大量无意义的模式中。因为轴承转动体会产生庞大的以振动信号为形式的数据,所以很有必要使用一种合适的“兴趣度”度量来在振动数据中寻找具有很强关联的频率行为模式。为了解决这个问题,在这篇文章中,我们提出了关联频率模式。这种模式不仅仅在振动数据中捕捉关联性共生数据,也捕捉与这些关联性共生数据相连的短时相关性。

在我们的这种方法中,我们利用关联频率模式从FFT结果中提取一系列频率,去从已知故障数据中捕捉故障特征。通过分析这些频率模式,是可以记录轴承从出现缺陷到失效点来临之时的状态的。这些都有助于减少由于轴承故障而造成的经济损失,因此提高了可靠性。更重要的是,在噪声环境下,传感器在机械工作状态下时收集的数据可能是异常的。因此,从轴承数据中检测异常行为是非常重要的并且在MCM中仍然是关键的项目。现在在轴承数据中所使用的异常检测技术是以分类为基础的,但这些技术都受到维数的限制。最近,一种通过从事务性数据库中发现频率模式来进行异常检测的新趋势正在被研究。尽管在传感器网络以及事务性数据库领域中,行为模式已经被深入研究过了,但这些模式在MCM异常检测方面的作用至今还未得到发掘,为了让我们更好的理解,这是用行为模式挖掘技术在振动数据中识别故障频率和异常的第一步。

本文所提出方法的结构如图二。在结构的第一步,原始振动数据将会利用快速傅里叶变换(FFT)进行预处理。在第二步,被处理数据(内圈、外圈和球轴承)将被用于挖掘关联频率模式,在这里每一个从快速傅里叶变化(FFT)分析结果中得到的频率都会被视为一个事件去检测一个对象。这些频率模式提取了故障和异常的特征。一个振动数据流由连续数据流和以时间顺序出现的一连串的被记录振动构成。随着数据流的涌入,旧信息将会过时,最近的信息将变得重要。因此,需要基于机械的单通滑动窗从数据流中发现新的重要信息(如新的故障特征)。

图二 新方法结构示意图

为了达到上述目的,我们提出一种单程树结构,被称为SAFP-tree(关联频率模式滑窗树),还有一种新算法,称为SAFP(滑窗关联频率模式),用于使用滑动窗口对振动数据流进行处理。我们的SAFP算法能够在当前频率窗口下从数据流内容一批一批的中提取重要信息,并且有效的挖掘关联频率模式。在最后一步,这些模式将会用于识别故障频率。此外,SAFP是对用于异常检测的SAFP-AD(基于SAFP的异常检测算法)的加强。大量的实验分析表明我们提出的技术对于利用振动数据发现轴承故障和异常是十分准确和高效的。需要被指出的是,这项技术适用于以监控为目的检测任何振动或无线电频率异常数据,例如应用在工业机械诊断,土木结构健康监测,野生动植物和生物声学监测等。

在本文的其余部分安排如下。在第二段,描述数据预处理过程。在第三段,推演树形结构和关联频率模式(AFPs)挖掘算法。第四段,讨论在状态监控领域内SAFP-tree的使用。在第五段,展示和分析实验结果。最终在第六段总结论文。

2 数据预处理

在这段中,我们描述对从轴承数据库中收集的原始振动数据的处理过程。被记录的振动数据需要以特定的频率形式呈现以便于每个频率用于事件检测对象。为了获得频率,振动数据首先要被一个固定的尺寸合适的矩形框划分成单位时间戳窗口。例如,一个长度为l的信号X利用一个尺寸为W的窗口被分成m个时间戳(4):

任意时间戳i内的振动信号X和W窗口尺寸可以被表示为(5):

这里i=1,2,3,hellip;,m,w=1,2,3,hellip;W。根据机械运行状况和周围环境的不同,被捕获的振动信号可能具有伴随故障特征的各种程度噪声。为了了解不同层次噪声的影响,从机械上记录下的振动数据时间戳都被加入了加性高斯白噪声(AWGN)(6):

利用加性白噪声,各种信噪比(SNRs)水平都能够得到,以了解噪声对故障和异常检测的影响。

Xi的时间域内容是平移变量,因此不适合用这种频率节点的表示方式。平移不变量频率节点的提取信息和其表示需要时域内容被转化成为频域如(7):

在(7)式中获取的频率是时间域的,xi平移不变表示。W窗口大小,fi包含W / 2 1频率。 使用(8)fi特征标准化为:

在(8)式中的是振动信号的平移不变量表示,每个频率分量都有连续的幅值。频域关联模式挖掘的应用要求每个频率分量以两种可能分类中的一个进行表示;满足为(1),不满足为(0)。为了得到这个表达,一个阈值将会被用于将每个频率分量的连续幅值转换成二进制状态值,如(9)式子:

在(9)式中,是时间戳下的频率节点。最后,我们需要准备一个数据集T,用来存放m个包含所有频率和对应节点的时间戳来进行关联模式挖掘(10):

在式(11)中得到的包含了在特定时间戳内满足条件的节点的所有频率。集合包含用于识别关联模式(即频率)挖掘的所有时间戳的满足条件传感器节点的所有频率。

3 关联频率模式挖掘

在这一段中,我们首先描述关联频率模式的准备工作。接着展示SAFP树形结构和用于故障识别和异常检测的关联频率模式(AFPs)挖掘过程。

3.1 准备工作

令F={为轴承振动数据中的一系列频率(在预处理之后以hz为单位)。我们假设时间被分成等长时间段t=,如tj 1 minus;tj = lambda;, j isin; [1, q minus;1],lambda;是时间段的长度。F的一个子集P集合被称为一个频率模式。一个振动数据流(VDS)能够从形式上定义为一个无穷的时间(e)序列,即如VDS=[),,r isin; [1, n],r表示第r个时间段。每个时间段都是一个元组E(Ets, P),P是在同样时间戳内出现的频率模式,Ets是时间段的对应时间戳(TS)。令size(E)为E的长度,即是E元组内的频率个数。窗口W可以被视为一个包含第r个和第s个内所有的时间段的集合(s)r),并且W的长度|W|=s-r。假设每个窗口W都包含许多相等的非重叠时间段批次。因此,如果W中有M个时间段和N个批次,那么每个批次中包含着M/N个时间段,并且因此,每个批次的长度是|M/N|。让窗口按时间批次进行滑动(即是在当前窗口内加入一个新批次并移除一个旧批次)。图三展示了一个说明时间段、批次和窗口概念的数据集。

图三 振动数据流(VDS)

定义1(W窗中的模式P支持度):W窗中一个模式P的支持度,被表示为(P),其为包含模式P的W窗口中时间段的个数。因此,一个模式在窗口W中被称为频率,如果其支持度不低于min_sup(最小支持度),例如0 lt; min_sup lt; |W|。那么在窗W中模式P的最大频率支持度可以被定义为:

(模式P中任意一频率出现的最大次数)

定义2(W窗口中的模式P总体置信度):W窗口中模式P的总体置信度,被表示为,定义如下: (12)

定义3(W窗口中的关联传感器模式P):如果总体置信度大于或等于W窗口中被给定的最小总体置信度阈那么W窗中一个模式P被称为一个关联频率模式。

对于一个给定的振动数据流,W窗口长度,最小支持度和最小总体置信度,进行关联频率模式挖掘的问题就转化为在W窗口中找到一系列完整的模式并能够满足相应的指定阈值。结果集是在振动数据流上挖掘的最近频繁关联的频率模式。

3.2 树形构造

在这一段中,我们讨论通过扫描一次数据流数据来构建一个关联频率模式滑窗树(SAFP-tree)的过程。 一个振动数据流可能会含有无限多个时间段,一批次时间段包含一组非空时间段。振动数据流结构图如图三所示,分为四个批次,每个批次含有相同数目的时间段。一个窗口由固定数量的非重叠批次组成,图三所示每个窗口含有三批次的时间段。

SAFP-tree 构造过程包含两个阶段:插入阶段和重构压缩阶段。图四展示了振动数据流(如图三)的窗口1与窗口2的SAFP-tree的逐步构建过程。为了简单起见,我们不在树中显示遍历指针。

a

图四 窗口1的SAFP-tree建造过程

对于插入阶段,SAFP-tree根据在振动数据流中的出现顺序来安排频率,并且通过一个接另一个插入振动数据流中的每个时间段来创建树。在这个阶段我们称之为

简单来说,其保持着一个频率标题列表,被称为F列表。使用F列表是为了保证在振动数据流的所有时间段中发现的每一个不同的频率与其出现顺序相对应并且清晰的储存了振动数据流中的每个频率的支持度数值。

在初始阶段,SAFP-tree是空的,利用图四(a)的空节点来构建树。第一个时间段包含的(即是TS=1)被插入树中lt;{}gt;。按照原样并以f1作为刚刚在根节点之后的初始节点并将f8作为最后一个节点的树的第一个分支。频率f2,f5,f6,f7和f8的支持度计数同时会更新。在符号,在图形中,lsquo;rsquo;表示频率fx具有如定义一中定义的支持度。在插入第二个时间段之前,TS=2的频率顺序被从{

全文共6577字,剩余内容已隐藏,支付完成后下载完整资料


资料编号:[13899],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。