仿人机器人的控制——人类的无创脑-机接口外文翻译资料

 2022-03-14 09:03

英语原文共 8 页,剩余内容已隐藏,支付完成后下载完整资料


仿人机器人的控制——人类的无创脑-机接口

Christian J Bell, Pradeep Shenoy, Rawichote Chalodhorn and Rajesh P N Rao

摘要: 我们这样来描述一个人脑—电脑传感器:它被我们用来进行控制一个仿人机器人,使之能够接受使用人脑大脑发出的信号,通过收集脑电波信号来获得非入侵性的信号。

脑电波信号技术已经在以前被使用过,那是在一个控制电脑鼠标以及拼写单词的一个项目中,但是很快人们注意到,当这个技术要进行一个更为复杂的控制项目时,此时要想将信号噪声控制在一个比较小的水平上,是不太可能实现的。在这里我们可以指出:促进机器人技术继续发展的一个原因,一个基于脑电波技术的传感器能被使用来命令自主仿人机器人的局部部分进行一些比较复杂的工作,比如走到一个指定的位置或者捡起一个指定的物品这样的一些任务。从机器人的摄像头进行的图像反馈允许使用者选择随意的一个工程在环境中,比如捡起一个东西或者运输到某一个被选择的地点。一项研究表明当有九位使用者对机器人进行命令,机器人能够在5秒钟内从四种可能的选择中进行精度高达95%的筛选。,我们的研究结果表明,基于脑电的脑-机接口可以用于复杂的机器人与环境的交互,不仅涉及到以前应用中的导航,而且涉及对象的操作和传输。

在神经科学和计算机技术的进步可以表明,最近已经可以出现一些可以由大脑直接控制的设备,如电脑屏幕上的鼠标和各种修复设备

大脑计算机接口(BCI)可能会在复杂的神经修复和瘫痪和残疾患者的治疗辅助设备上带来突破。一些控制上更复杂的演示,如假肢的控制,它依靠于记录大脑信号微创技术。非侵入性技术,如脑电图(EEG)从头皮记录,已用于界面的光标控制和拼写,但低带宽的信号提供了非侵入性,这让其使用过程变得更复杂,系统的使用也变得更难。

克服这一点的方法是:将代理中的自主权增加到执行BCI命令,例如一个具有障碍的轮椅[ 13 - 15 ]。为了扩展这一系列的工作,我们在这里进行简单的演示,我们可以利用机器人技术以及机器学习能力的进步,这样一来,我们要特别要指出的是,我们使用一个复杂的人形机器人,只需要用户下达的高级命令。该机器人就可以自动执行这些命令,而不需要繁琐的瞬间监视。利用动态图像的脑-机接口之间进行选择的替代方案,我们的系统可以无缝的将新发现的对象和环境进行一个互动。这使得用户不必在非常低的级别层面上进行控制,同时,允许诸如EEG之类的非侵入性信号用作低带宽控制信号。这种方法与神经修复的认知方法一致[ 16 ]。

在我们的界面中,受试者对机器人的命令是基于视觉诱发脑电图反应(P3)(11, 17, 18),当用户正在关注的对象突然变化时产生的。类似的技术已被用于先前在拼写实验[ 18, 19 ],并在机械臂[ 9 ]和[ 14, 15 ]控制轮椅等项目之中。在我们的例子中,P3是用来辨别机器人应该拾取哪一个物体以及机器人应该把哪个物体带到指定的地点。该机器人将其相机发现的对象的图像传回给用户以供选择。指示用户注意他们选择的对象的图像,而每个图像周围的边界以随机顺序闪烁。机器学习技术用于将主体对特定图像flash的响应分类为包含P3或否,从而允许我们推断用户的对象选择。类似的过程用于选择目的地位置。我们提出了一项涉及九名受试者的研究结果,该研究探讨了解码大脑信号所需的时间量、用户可用的选择数量以及对特定用户的接口定制的影响。我们的研究结果表明,机器人的命令可以从四个可能的选择,在5秒钟内达到95%的准确性。

1.材料和方法

1.1人类受试者

此项目从华盛顿大学的学生群体中招募了九名受试者(男八名,女一名)。受试者没有已知的神经学状况,也没有参与先前的脑机接口实验。这项研究获得了华盛顿大学人类试验科的批准,每个用户都给出了知情同意。参加实验的受试者得到了少量的金钱补偿。

1.2、用户学习协议

在用户研究中,当在环路中没有机器人的情况下,测试了基于P3接口的用户大脑信号解码的准确性。这些实验包括四个会话:(1)两个会话,其中有四个(随机选择)的图像在屏幕上的2个2的布局,(2)一个会话,六个图像在2 - 3的布局和(3)一个会话与六个图像在3 - 2布局。这些会话的顺序对所有用户都是相同的。因为我们的目标是设计一个界面,可以动态调整大小和重新排序,我们使用这些会议探讨是否在图像或布置在网格数量的变化会影响界面的性能。每一个会话持续了12分钟,其中包括一系列试验,其中一个图像被预先指定为目标,并指示该对象专注于该图像。图像周围的边界以每秒钟0.25秒的随机顺序依次闪烁,每幅图像闪烁十次。对于四个图像会话,每个图像位置为十个试验的目标,并且在六个图像会话中,每个图像位置被用作五个试验中的目标。从32个脑电图电极的数据被记录在采样率2048赫兹上,并随刺激时间信息存储在磁盘上。所收集的数据用于训练和测试不同条件下的分类器,如下所述。

1.3、分类方法

我们记录的信号在2 kHz的32通道布局之中,根据10–20布局[ 20 ],使用biosemi activetwo系统(biosemi,阿姆斯特丹,荷兰)。脑电信号进行带通滤波(0.5–30赫兹到100赫兹)下采样。我们使用了一个0.5秒的长数据窗下面的每一个瞬间,标记为目标/非目标,培养一个二元分类,预测是否一个给定的闪光中P300或不响应。

在多图像场景中进行测试时,使用该P300检测器对每个图像闪光进行分类,并将分类器输出添加到图像的连续统计分数中。从二进制分类器中输出最高分类器的图像被指定为选择过程的最终结果。此外,我们使用最近提出的空间投影算法[ 21 ]来设计事件相关脑电反应。简单地说,该算法考虑到一个事件的多通道时间序列响应,并将所有信道规划成一个最大的判别时间序列。用于优化的标准如下。让Ei用C矩阵的形式表示事件I的事件相关反应(C是通道的数量,T是时间点的数量)。设F是一个投影滤波器让席F T EI的线性加权组合的所有通道形成的特征的时间序列。我们可以计算类内和类间散布矩阵(分别为SW和某人)上所有席集和最大化的雅可比J [ 21 ]:

可以证明,这相当于最大化以下量:

SWJ直接从EIS [ 21 ]集计算。这是一个广义特征值问题,它的解是一个由数字排序的f向量的正交集。他们的特征值。我们选择前三个过滤器f来代表我们的数据。这一选择是从试验性的实验中获得的,在这里我们观察到第一个2 - 3个过滤器捕获了大部分的鉴别信息,而额外的过滤器并不能改善分类性能。

我们使用libsvm分类打包[ 22 ]在空间上的投影数据进行分类。使用线性软边缘分类器,并利用交叉验证对训练数据进行自由参数估计。

1.4、脑-机器人接口设计

我们设计了一个基于图像的BCI,它是动态的,可以通过适当调整大小来容纳可变数量的图像,并将它们安排在网格中。这允许接口将由机器人发现的动态生成的图像结合起来,并将它们作为用户的选择呈现出来。

在选择过程中,界面以随机顺序在每个图像周围闪烁一个薄边框。主题将注意力集中在感兴趣的图像上(例如,通过计算该边界的闪烁次数)。闪光灯每0.25秒出现一次,由前0.125秒可见的红色边框组成。

该接口实现上述描述的分类方案。数据处理的参数,即空间投影滤波器和线性分类器,在使用接口之前通过训练程序获得。培训课程包含10分钟的数据收集,与上面的用户研究类似。在我们的在线界面,我们进行空间投影和下采样,以达到减少实质数据。由此产生的三个投影通道,然后进行带通滤波和分类为每一个闪光。为每个图像保持连续的分类器输出,从而对目标图像进行连续估计。在任何步骤中,当前最大总的图像是最有可能的选择。例如,可以使用这种运行总量来缩短在较少的闪烁之后的处理,将注意力集中在分类器难以区分的较少图像或在不确定情况下增加闪烁的数量。我们的形象为基础的接口采用通用BCI2000软件[ 23 ]实施。

该机器人采用富士通HOAP-2人形机器人具有25个自由度,包括视觉反馈来把握对象的用户和双手云台摄像头。该机器人被编程为能够自主行走,基于视觉信息导航,并拾取和放置物体。机器人利用它的视觉定位感兴趣的对象,分割它们并将它们发送到脑机接口作为用户的选择。我们还使用了一个间接的摄像头来定位包含对象的表,这些表可以作为被拾取对象的目的地。

2.实验结果

在第一组实验中,我们收集了来自九名用户的数据,并使用这些数据测试了在脑-计算机接口中使用的P3分类器的性能。用户参加了两个会议,每个会议包括一些试验,涉及四个随机选择的图像显示在计算机屏幕上。我们使用第一届会议的数据计算了这些数据的前三个最大判别空间滤波器,并训练了一个二进制分类器来检测用户的P3响应(详见第1节)。我们从第二届会议的数据上测试了这个分类器的性能。分类结果准确性的跨学科为98.4%,标准差为2%,即几乎没有错误点。没有空间滤波器的分类性能,即使用所有32个原始EEG通道,为97%。

为了探索我们是否可以减少每个刺激使用的闪光灯的数量,从而研究速度准确性权衡,我们测量了分类精度作为闪光灯使用次数的函数。图1(a)显示了这种精度度量,在所有主题中都是平均的,并且不使用空间滤波算法。请注意,这四类问题的机会级准确率是25%。如图所示,即使只有五次闪烁,其他学科的准确率也达到95%。因此,对于一个四选择问题,

可达到每5秒发出一个精度达到95%的信号,24bit/min的比特率。

2.1、改变选择的数量

我们的界面被设计成动态地适应由机器人检测和交流的可变数量的选择。一个自然的问题是改变图像的布局或数量是否影响性能。为了测试这一点,我们使用了四个图像会话作为训练数据,并对涉及从六选择的任务进行了测试。2times;3图像和3times;2 layouts1。如图1(b)所示,这六类问题的分类准确率仍然高达93%(标准偏差为3.1%),相比之下,16.6%的机会水平。这些结果表明,将屏幕上的选项数量从四增加到六,并更改它们的布局不会显著影响界面的性能。

图1:脑-机接口的性能。(a)接口中的速度精度折衷。该图显示了所有受试者的平均准确度,作为每种选择的闪光次数的函数。请注意,即使只有五次闪烁,精度也提高到大约95%,表明命令可以以更快的速度发出,如果需要的只是一个小的精度损失。该图还表明,空间滤波方法比使用来自32个通道的原始数据更好。(b)六选择任务的执行情况。该图显示了受试者的平均分类准确率,作为每个刺激的闪光数的函数。这两条曲线代表两个不同的布局的六个图像在屏幕上:2times;3和3times;2。

2.2、跨学科推广

我们还研究了一个问题,即是否有可能设计一个分类器来概括不同的主题;这将允许例如,放弃一个用于训练特定主题分类器的初始数据收集步骤。我们对除一个主题以外的所有数据进行分类器训练,并对该主题的数据进行性能测试。图2(a)显示了该方案的平均分类精度,在所有主题中平均为闪烁数的函数。使用主题自己的数据进行训练时的分类精度也可供比较。很明显,虽然对主体自身数据进行训练的分类器执行得更好,但泛型分类器的性能显著优于偶然(十个闪烁案例的准确率约为78%,而概率水平为25%)。这支持了假设,视觉诱发P3响应闪光图像是强大的,共享学科之间的相似性。另一个最近的研究[ 24 ],使用较大数量的一个拼写范式选择发现显著的个体差异之间的对象,和一个广义的分类到一个特定主题的分类进行有差计算。

图2:对分类器性能的训练数据的影响。(一)推广跨学科。图中比较了业绩预训练的分类器在小说的主题(全局分类器)随着训练的分类器的训练数据集的性能。平均分类准确率在所有的科目中表现为一个闪光的每幅图像的数量的函数。特定主题的分类是更好的预期,但预训练的分类器(全球通用“分类器”)明显优于机会执行(78%精度和25%的机会)。(b)培训时间的影响。图中显示的分类精度在科目训练时间量的增加。三分类的平均准确率如下所示:(1)当预训练的跨学科分类的基准是用(全局分类器),(2)一个特定主题的分类建立在一个通用的空间投影(全球空间滤波器)和(3)特定主题的分类与主题空间滤波器(只有主题的数据)。我们看到,3–4分钟的训练数据,特定主题的分类

2.3、培训所需时间

探讨的时间专门收集训练数据量影响界面的性能,我们计算分类精度测试数据使用不同数量的训练数据。用于训练/测试数据的平均响应每个图像在十闪烁在每个试验。图2(b)显示测试数据的平均分类准确率。相比之下,从跨学科的分类精度(图2(a),所有十次精度)表现为基线的情况下,没有训练数据的使用。从图中看出,平均精度急多输入训练数据的预期上升,但即使只有3–4分钟的训练数据,精度已达约95%。这些结果支持了学习的个性化分类,而不是依靠一个通用的P3探测器每个学科一个短期培训课程的使用。

最后,为了更好地理解本研究中使用的脑电反应的特性,我们从所有受试者的联合数据中学习了三个空间滤波器。这些过滤器可以看作是捕捉鲜明的EEG信号在头皮的功能,字符里诱发反应目标闪光。如图3所示,顶叶和枕电极似乎与歧视性活动有关。这是与其他研究涉及P3参赛者一致(例如,[ 25 ]),其中顶叶电极已发现有助于显着除了经典的用于检测P3响应枕电极性能。

图3:诱发反应的特征。显示的是从所有主题的数据中学习的前三个空间滤波器(红色表示高的正值;蓝色表示高的负值)。空间滤波器平滑变化,主要集中在枕叶和顶叶区域,是适合一个视觉空间注意任务,如利用一个接口地区。

2.4.利用接口控制机器人

我们用大脑–计算机接口允许用户命令富士通HOAP-2人形机器人拿起一个理想的对象,把它带到一个选定的位置。图4(a)显示双色的对象在表可用于拾取和其他两表作为景点场景示例。对象与机器人的摄像机拍摄的,分割和作为选择通过大脑计

全文共11412字,剩余内容已隐藏,支付完成后下载完整资料


资料编号:[16228],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。