基于SVM的脑机接口多类算法分类外文翻译资料

 2022-03-14 08:03

英语原文共 10 页,剩余内容已隐藏,支付完成后下载完整资料


基于SVM的脑机接口多类算法分类

摘要

模式分类算法是脑机接口系统应用中的关键一步,本文提出了用分层支持向量机去解决基于EEG的四分类运动想象分类任务,用小波包变换对原EEG信号进行滤波,带有有效频次的EEG信号将会被分组然后重组。然后用一对多的共同空间模式和一对一的共同空间模式分别从重组EEG向量中提取出EEG的特征向量,再用两层分层支持向量机算法对EEG特征向量进行分类,其中一对一共同空间模式被用在第一层,一对多共同空间模式被用在第二层。BCI Competition Ⅳ-Ⅱ-a这个公共数据集被用来验证这个方案是否有效,5倍交叉验证的结果证明这种分类的平均准确率在第一二层分别为67.5plusmn;17.7%、60.3plusmn;14.7%,总体来说,这一分类的平均准确率为64.4plusmn;16.7%。结果表明这种方案对四类运动想象分类是有效的。

关键词:脑电图,运动想象,共同空间模式,分层支持向量机

  1. 介绍

一些患有神经类疾病的人因为没有健全的运动控制系统,在走路、说话、书写方面会有困难,例如肌萎缩侧索硬化患者、路格里克氏病患者、高位脊髓损伤患者 ,都无法自主控制他们的肌肉运动。因此,他们无法靠自己完成简单的生活日常,也无法与生活环境产生互动,甚至有时会被当成负担而被社会淘汰。脑机接口技术可以被应用到治疗这类病人的医疗设备中,以此提高他们的生活质量。其原理是,当残疾人做出或想象出运动方式的时候,可以检测到他们的意图,这是通过分析他/她的脑电信号实现的,然后将其转化为指令进行传输,或者直接控制家用设备。这为残疾人和他们的家属都提供了更高的生活提升方式。出于对相关技术的安全考虑,基于脑电图的无创脑机接口系统被普遍应用在辅助设备里,比如题词拼写器、轮椅控制还有电子游戏。另外,无创脑机接口系统在对重度瘫痪病人的大脑活动评估中可能很有益,以此来预测分析创口脑机接口的功效。

许多生理机制都可以发出脑电信号,比如运动想象、稳态视觉诱发电位还有P300信号,都能被脑机接口研究者们研究探讨过。与稳态视觉诱发电位和P300信号相比,运动想象可能是最有潜力成功的,因为它独立于外部刺激,使得异步控制与通信能够实现。

传统的共空间模式可以被译为数学或生理两种,对于运动想象脑电信号的处理——特征提取,被认为是一种有效的方法。然而,传统的共空间模式方法更适用于两类运动脑电信号数据分类。加之它对噪声太敏感,且不适用于小规模数据库。为了解决四类分类,传统的共空间模式通过计算被拓展为一对多的模式。另外,不少提高共空间模式有效率的方法被提出,用来为共空间模式算法选择最优时间频带。例如,正规化条款作为先导知识被加入规范共空间模式。通过添加共空间模式的概率副本,概率共空间模式可以利用两个共用基础矩阵的线性高斯生成模型推断空间模式。Filter bank共空间模式是将一段频率带截成小段的非重叠滤波,被提议利用在基于运动想象的脑电信号脑机接口系统。然而,Filter bank共空间模式对于特定的频率带的计算非常复杂。

本文提出了一个数学范例,包括针对四类运动想象分类的一对一、一对多共空间模式策略。首先计算十个共空间模式,提取它们的特征向量,一个分级支持向量机用来定位配合这些特征向量。设计的算法会被应用于9个人类主体的脑电信号数据,以此与4个运动想象任务进行区分。感觉皮质是颅内皮质的区域,参与计划、控制与执行自主移动。这块皮质负责运动想象任务,因此,它是传送命令、与肌肉进行反馈交流的重要组成部分。图1展示了感觉皮质的不同区域,是在此次研究中考虑接入电极的区域。

本文的余下部分将照此组成:第二部分会介绍实验测试,对设计算法的所有步骤也会详细说明。第三部分将呈现运动想象分类的所有结果。设计算法在不同试验条件下的优缺点将会在第四部分进行讨论。

图1.感觉皮质的不同区域

二.方法

(一)脑电图数据库

本文数据库来源于脑机接口竞赛中的数据,实验包括四个任务:左手、右手、双脚以及用舌头移动9个物体。如图2(a)示,利用大约250Hz的抽样频率,脑电图信号从22个电极和3电极眼电图频道(左乳尖作为参考点)中提取记录,带通滤波设置在0.5~100Hz之间,电源线干扰被另加的50Hz陷波滤波器滤波。图2(b)所示为范例的计时方案,关系脑电图实验更多的细节会在第三部分给出。

脑电图数据由两个分期组成,由于把脑电图数据的非平稳特征作为参考因素,对其进行了不同时间的记录。每个分期有6个过程,被分成小片段,每个过程有48个检测段,对每12检测段分一组。因此次,一个分期由288个检测段组成。对于数据分析,每个检测段通过它的运动想象任务的所属类别被分离提取,从而得到每个任务的72个有效检测段。5倍交叉验证被用来抵消过度拟合的影响。在5倍交叉验证中,72个检测段的原始样本随机分组成5个子样本。在这个5个子样本中,其中4个被用于训练数据,剩余1个保留作为检测模型有效性的验证数据。对于4个运动想象任务,包含了56个检测带的数据库。交叉验证重复5次,最后保证5个子样本都能作为1次验证数据。

图2

  1. 实验过程

运动想象会在对侧半球引起事件相关失步和同侧半球的事件相关同步,因此,有关皮质脑电信号的mu;节律(8-12Hz)和beta;节律(14-30Hz)将会提高或降低它们的振幅以及频谱攻略。另外,脑电信号中的高频成分通常是星云状,所以一般用3-34Hz的带通滤波器对原生脑电信号滤波。五级小波包分节被用来分析滤波脑电信号(3-34Hz)。第五级分节元素{}对应于确定的频带。比如,当仅考虑[3,34]Hz频率带内的滤波脑电信号,对应接下来的频率带为{},其中,是32Hz。正如图3所示,位于[25,34]Hz带宽内的重组脑电信号的振幅非常的低,而且在运动想象的记录中基本看不到变化。因此,只选择位于[3,25]Hz的频率带进行特征选择。

图3

  1. 一对一及一对多的共空间模式

基于脑电信号的脑机接口两级分类任务已经提出了共空间模式,但是对于本研究考虑的四级分类问题,则应用一对一、一对多共空间模式策略处理特征选择。

首先,分别标记左手、右手、双脚和舌头的运动想象为1、2、3和4。如图4(a)所示,一对一策略选择任意两类成为一组用于传统共空间模式,这样一来,1个四级分类问题转化成6个两级分类问题。

令表示第i级重组脑电信号,iisin;{1,2}。每个检测段中的维数为,N和T分别代表时域里每个检测段中的信号渠道数量和样本数量。针对不同的对象,规定样本数量可以变化。

图4

第Ⅰ级中一个检测段的方差为:

其中代表的倒数,trace定义为矩阵中主对角线元素的和,空间协方差通过对每一个组的所有检测段取平均后进行计算。

综合空间协方差:

被分解成:

其中是由特征向量组成的矩阵,是特征向量的对角矩阵,这样定义使得特征向量以降序分类。

白化变换定义为:

经白化:

共享同样的特征向量,因此,可以被分解为

的和作为验证矩阵

这意味着在中最大的特征向量 对应于中最小的特征向量,因为两者之和恒为1。B中的特征向量将用来进行两级分类。当白化脑电信号被投影为第一个或最后一个特征向量时,最佳特征向量将被给出以鉴别两种脑电信号的特征。投影矩阵为:

给出检测段的投影为:

的行可以看作是脑电信号的原代码分配向量,其列是共空间模式。根据Eq分解白化脑电信号,可以得到分类所需的特征。在这种方法中,对于运动想象的每一级,仅需要一个小型信号库的方差来进行分类训练。

如图4(b)所示,在一对多策略中,一级被定义为目标级,另外三级则组合成对立级。类似于共空间模式,需要计算每个检测段的协方差和白化变换。然而,共空间模式以不同的方式进行计算:

通过白化变换,被变换成,定义为:

在对角化阶段中,可以被分解为:

由此可以得到 的和为:

推导出投影矩阵为:

检测段的制图为:

特征向量通过下式进行计算:

表示脑电信号的最佳投影的方差矩阵,通过共空间滤波器得到。对于一对一和一对多策略,最终定义其组合特征向量为:

其中表示对应于一对一策略的脑电信号特征向量,用于训练一对一分类器;表示对应于一对多策略的脑电信号特征向量,用于一对多分类器的训练。

  1. 分层支持向量机

在本研究中,传统的支持向量机被用来监督[4,23]频率带的分类。支持向量机的基本思想是将输入到一个高维特征空间,然后找出最优决策超平面,在这个平面里,数据点以最大余量被分离为不同级。

决策超平面定义为:

是常向量,是分离超平面的偏差量。决策超平面可以通过解决如下的优化问题被找到:

  1. t

是第i次输入样本,是的类标签值,是输入样本的数量,是松弛变量,

使得样本能够进入范围(,也被成为边际误差)内,或者判断出错误分类(),是惩罚因子,由用户选择,的值越大,对应于给误差更高的惩罚。

式(21)可以利用拉格朗日优化,通过双重问题来解决:

(23)

通过下式进行计算:

(24)

是拉格朗日乘数,是支持向量机的个数,是核心函数。另外,径向基础核心函数被用来研究脑电信号的非线性特性,可以作如下表示:

是核心参数,表示转换数据的伽马分配,惩罚因子控制分类对错的惩罚等级,两者不断修正以寻找最优分离超平面。因此,对提高支持向量机的正确率和分类效率来说十分重要。研究中,应用了网格搜索对进行优化,为了避免过度拟合,使用了十倍交叉验证训练分类器。

如图5所示,分层支持向量机的范例设计用以优化分类。在第一、二层里,分别使用了4个一对多、6个一对一支持向量机分类器。

预处理之后,在具有4个一对多支持向量机的第一层输入脑电信号特征信号,对于一对多支持向量机,分类会导致一对多支持向量机可能是“一级”或“多级”。定义“一级”这一结果作为有效分类结果,因为“多级”结果以为着存在其他三种可能级。要注意的是,这个有效结果不等于这个结果就是正确结果。

图5

这种方法可能产生的结果如表1所示,并分为如下三类:

  1. 仅有1个一对多支持向量机 能得到有效结果,而其他三个将得到“多级”的无效结果。
  2. 任2个一对多支持向量机得到有效结果,另外2个得到无效结果。
  3. 与1.2不同的任意结果。

表1

对于情况1,所得结果即为最终分类结果,这段检测带会被标记。在第

一层的准确度值会通过所有标记检测带计算得到。没有被标记的检测段则被传至第二层,第二层的准确度值通过这些在一层里没有被标记的检测段计算获得。

对于情况2,根据两个有效结果,脑电图特征信号被传送至一个相应的分类器。比如说,第1级和第2级在第一层都是可能的分级,这个检测段将会被传送至相对于第1级和第2级的分类器。这个分类结果即为最终结果,检测段也会被标记。

对于情况3,脑电图特征信号进入6个一对一支持向量机分类器,可能出现的结果如表2所示,并采用投票规则。对于情况1 ,在一对一支持向量机分类器中,“一级”出现3次。因此,这个就是最终结果。在情况2中,“一级”或者其他结果仅出现2次,便无法确定最终结果。即这个检测段无效,并计为错误分类。

最终正确率由第一和第二层支持向量机正确标记的检测段数目除以总的实验数280(5次交叉验证,1次56个实验检测段)得到。

表2

三.实验结果

一个包含56个检测段的数据库被用来验证所提分级支持向量机分类的有效性,最终结果在第一级和第二级分别为64.4plusmn;16.7%和69.16plusmn;16.0%,两级的脑电图信号也被分析了。

第一层的分类结果如表3所示,有效检测段和正确结果的数目分别为27.4plusmn;7.8和19.4plusmn;9.4,总体上第一层的平均准确率为67.5plusmn;17.7%。有效检测段和正确结果的最大值为对2号物体达到35.0plusmn;5.3、对3号物体达到30.2plusmn;4.1。其中最高准确率是对3号物体,达到88.3%。

表3

从表4可以看到在第二层的分类结果,其中“剩余”表示被归为“多级”的检测段。“剩余”和正确检测段的数目平均值分别为27.4plusmn;7.8、19.4plusmn;9.4,平均准确率为67.5plusmn;17.7%。在第二层,1号物体的“剩余”检测段达到41.8plusmn;1.3,正确分类检测段达到28.8plusmn;1.6个。最高正确率来自7号物体,有75.4%。

表4

为了计算出图6所示的整体分类准确率,将第一层和第二层达到正确结果数相加,再除以数据库总数。最高准确率来自

全文共6439字,剩余内容已隐藏,支付完成后下载完整资料


资料编号:[16341],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。