

英语原文共 5 页,剩余内容已隐藏,支付完成后下载完整资料
摘要
这个章节介绍了一种预期的语音识别系统的技术,它涉及机电应用的语音控制,特别是语音控制移动机器人或残疾人智能轮椅。我们的目标是使用自然和直接的通信技术与机器人交互。本章的目的是研究如何利用高识别率来处理声音,使轮椅获得正确和安全的运动。为了使语音成为人与机器人之间有效的交流工具,必须实现较高的语音识别率。但是在一般环境下实现100%的语音识别率几乎是不可能的。在这一章中,我们提出了一种用于孤独单词识别的多正则列变换(Multiregdilet transform)技术。最后利用神经网络(NNT)的输出,通过计算机笔记本和专用接口硬件对轮椅进行控制。获得了98%的成功识别率。
关键词:人工神经网络,多脊波变换,多小波变换,接口电路。
Ⅰ.介绍
由于人类通常通过声音进行交流,所以如果用声音来指挥机器人是非常方便的。轮椅是残疾人的重要交通工具。然而,对于那些饱受痉挛和四肢麻痹之苦的人来说,操纵杆是一个毫无用处的操纵工具。
Ⅱ.系统设计
以下5种声音指令分别用于轮椅的前进、倒车、升降、右转和停止等不同操作。椅子开始向相应的方向移动,发出向前的命令,如果命令停止,则停止,以此类推。
2-1语音数据库
每个说话人识别系统主要依赖于数据输入。系统中使用的数据是语音。这篇演讲由15名演讲者发表,其中8名男性,7名女性,其中10名用于培训目的(5名男性,5名女性),每个演讲者说同一个单词5次。
2-2 tiregdilet变换
为了提高脊波变换的性能,克服脊波变换的缺点,提出了一种多脊波变换技术。脊波变换的主要思想是利用Radon变换将一个直线采样方案映射成一个点采样方案,然后利用小波变换在Radon域中有效地处理点采样方案[Minh, et al., 2003]。而多小波变换的主要思想是通过对脊波变换的第二部分进行多小波变换来提高脊波变换的性能和输出质量。
Ⅲ.神经网络
人工神经网络(ANN)是指以“生物神经网络”为类比对象的计算系统。许多涉及智能或模式识别的任务是很难自动化的[Ram Kumar等人,2005]。
3.1神经网络模型
我们使用0附近的随机数初始化网络中的权值和偏差。培训过程需要一组适当的输入和目标作为输出。在训练过程中,对网络的权值和偏差进行迭代调整,使网络性能函数最小化。
Ⅳ.拟用系统的通用程序
本章共分两部分,第一部分为理论工作(借助matlab 7进行计算机仿真),第二部分为计算机与轮椅的接口。
4-1预处理:
在本节中,将孤独的口语单词分割成等长(128个样本)的帧。接下来,将每个单词的结果帧转换为单个矩阵(2维),这个矩阵必须是2的幂。因此,所有字的建议长度是16348(一维),这个长度是2的幂,可以分为矩阵有维数(128times;128,这是二维的,2的幂矩阵)。
4-2分类:
这一步从得到二维离散多脊波变换系数开始。系数分解器分为两部分,第一部分作为参考数据,第二部分作为测试或分类数据。对二维离散多脊波变换得到的参考数据(系数)进行训练后,采用一种反向传播算法作为分类器的神经网络是一种简单的强信号识别方法。
4-3一维信号的FDMWT计算:
采用预处理(重复行)的过采样方案,将离散多小波变换(DMWT)矩阵的维数与输入的维数相比增加了一倍,该矩阵为方阵NxN,其中N为2的幂。变换矩阵维数等于预处理后的输入信号维数。
Ⅴ.研究任务
本作品中使用的轮椅有三根连杆(一根在轮椅前,两根在轮椅后)连接轮椅的两侧;每个杆的中间都有一个关节,这样轮椅就可以移动了。该轮椅宽65厘米(25.5英寸),长127厘米(50英寸),测量后脚轮完全延伸到椅子后面。托盘的前部离地76厘米(30英寸),座位的底部离地51厘米(20英寸)。机器人轮椅是由图(1)所示由BEG公司(英国公司)用操纵杆制作的轮椅制作的。
图(1) 将改造轮椅的背影
5.1 轮椅的重量
单轮椅重量为17kg,带两个电机和实验电路的轮椅重量为20kg。坐在轮椅上的人的实际重量是65公斤。所以连人加轮椅的总重量是85公斤。在相同的工作和表现上,轮椅上人的体重最大是80KG,所以连人加轮椅的总重量为100kg。我做实验项目在轮椅上人重量是65公斤,这轮椅如图(2)实践经验给了优异成绩表(5)所示。从这个表我得出结论,该方法是比以前更好的方法。
5.2 轮椅的电磁
这项工作使用的电池是湿电池,湿电池利用铅和硫酸之间的化学反应来产生电能。由于电池需要灌满蒸馏水,所以它们的维护率较高,但比凝胶或AGM(吸收玻璃垫)电池更轻。
5.3 轮子
轮椅有四个轮子,两个后轮和两个脚轮,两个脚轮被钩在轮椅前面的基座上,所有的轮子都有相同的直径(18厘米)。
驱动轮位于底座两侧的后部,允许座椅根据声音指令转动,车轮直接与齿轮系啮合,通过每个车轮和螺母上的两个凹槽将扭矩从电机传递到车轮。
5.4 发动机
发动机可以说是移动机器人平台中最重要的部分之一。功率过大的电机会导致效率低下,并且会浪费原本就有限的车载电池供电,而尺寸过小的电机在关键时刻可能会出现扭矩不足的情况。还必须考虑电机的最佳转速和可用转速范围。电机轴的输出转速过高,会导致机器人以快速、不可控的速度运行。输出过低,机器人将无法达到一个合适的速度来满足用户的需求。电机的旋转输出也对性能有影响,因为如果转矩不够,在某些情况下可能不会发生运动。因此,在选择合适的平台电机时需要进行大量的考虑[Philips, 2003]。
图2 轮椅用直流电动机
Ⅵ.原有轮椅增加了硬件组件
在原有轮椅的基础上增加了以前设计的操纵杆(特别是针对痉挛和四肢麻痹的伤病者,根据伤病者的受伤情况对轮椅功能进行了修改),使其物理设计更加真实。它是各种物理(硬件)和计算(软件)元素的组合,将轮椅的子系统混合在一个单元中工作。在硬件组成方面,轮椅增加的主要组成部分是接口电路、麦克风(耳机麦克风)和笔记本电脑(主机)。
6.1 麦克风
高质量的麦克风是实现语音识别的关键。在大多数情况下,一个桌面麦克风是做不到这一点的。他们倾向于接收更多的环境噪声,这给ASR程序带来了困难。手持麦克风也不是最好的选择,因为它们总是拿起来很笨拙。虽然它们确实限制了环境噪声的数量,但它们在需要频繁更换扬声器的应用程序中最有用,或者在与识别器对话不频繁的情况下(当不需要戴耳机时)最有用。最好的选择和目前最常见的是耳机的风格。它允许周围的噪音最小化,同时允许你一直把麦克风放在舌尖上[Cook, 2002]。手动设置是可用的,没有耳机和有耳机(单声道或立体声)在这项工作的手机(FANCONG FC-340)是可选用的。
6.2 继电器驱动接口电路
发射信号可用于开关功率更高的设备,如电动机和螺线管。如果需要,继电器可以由单独的电源供电,例如12V电机可以由笔记本电脑的并口控制。自由流阻二极管可用于保护继电器触点,防止继电器断开时晶体管受到损伤。
控制信号(输出)之间的一个中间阶段控制信号(并行端口的输出)和发动机由一个组件的组合继电器、晶体管、二极管、电容器、电阻器和缓冲74ABT245如图(3)和(5),它使用并行端口抵御任何预期的损失,74ABT245高性能BiCMOS装置结合了静态和动态功耗低和高速度和高输出驱动如图(6)所示。
图(3) 固定的继电器接口 图(5) 引脚配置
图(4) 继电器接口电路
74ABT245设备是一个八进制收发器,具有发送和接收方向上不可逆的3状态总线兼容输出。控制功能实现最小化外部定时需求。该设备具有一个输出使能(OE)输入方便级联和一个方向控制(DIR)输入[buffer 63]。
Ⅶ.仿真结果
7-2 实验结果
为了检验所提算法的性能,我们进行了一些实验测试,实验中使用了不同类型的语音命令,如go、back、right等。
7-2-1 线性路径
轮椅可以通过单一的线性路径孤立语音命令“去”和“返回”用户推荐,根据指定的方向图(6)显示了线性运动轮椅,轮椅的运动无论是积极的还是消极的方向轴当轮椅的车轮后方(开车)有相同的旋转方向(顺时针或逆时针方向的两个轮子旋转)。
图(7)为轮椅从指挥路径的误差路径,图中为x轴。
图(6) 对应“GO”语音命令的线性路径 图(7)为实际轮椅直线运动路径
7-2-2 圆形轨迹
根据用户推荐的指定方向,可以通过单独的语音指令“左”或“右”来获得轮椅的圆形路径,图(8)显示了使用语音指令“右”顺时针旋转轮椅的运动情况(V1=0, V2= not 0)。
这些语音指令生成圆形路径,用以停止轮椅旋转运动的“停止”语音指令。
图(8) 旋转对应“右”语音命令
Ⅷ.总结
本章提出了一种孤立字语音识别系统的方法来控制轮椅,从而使所提出的技术在实时操作中更有效地应用于移动机器人的控制。本章提出了一种二维多小波变换计算方法,该方法验证了多小波变换的潜在优点,并在低计算复杂度方面得到了很大的改进。
参考文献
[1] Cook S., 2002,”Speech Recognition How To”, Revision v2.0 April 19, 2002.
[2] Hosseini E., Amini J., Saradjian M.R., 1996, 'Back Propagation Neural Network for Classification of IRS-1D Satellite lite Images', Tehran University, 1996.
[3] Hrnčaacute;r M., 2007, ' Voice Command Control For Mobile Robots', Department of Control and Information Systems Faculty of Electrical Engineering, University of Žilina, Žilina 2007.
[4] Komiya K., Morita K. , Kagekawa K. and Kursosu K., 2000, 'Guidance of a Wheelchair by Voice ' proceeding of IEEE,PP102-107,2000.
[5] Li J., Pan Q., Zhang H. and Cui P., 2003, 'Image recognition using Radon Transform', Proceeding of IEEE, 2003.
[6] Lim S. and Jeon J., 1997, ' Multiple Mobile Robot Interface Using a Low Cost Voice Recognition Chip ', Department of Mechatronics, School of Electrical and Computer Engineering, proceeding of IEEE, PP 402-407,1997.
[7] Mahoney R., 1997, ' Robotic products for rehabilitation: Status and strategy', Proceeding of IEEE, 1997.
[8] Minh N. and Vetterli M., 2003, “The Finite Ridgelet Transform for Image Representation”, Proceeding of IEEE, January, 2003.
[9] Moon I., Lee M., Ryu J. and Mun M, 2003. 'Intelligent Robotic Wheelchair with EMG, Gesture, and Voice-based Interfaces', Proceeding of IEEE, PP 3453-3458,October 2003
传记
P.V.L. NARAYANA RAO出生在印度安得拉邦奎师那地区的Vijayawada。他完成来自印度北方邦阿拉哈巴德的山姆·希金伯顿农业、技术和科学研究所(前身为阿拉哈巴德农业研究所)的M.Tech,并在印度哈里亚纳邦法里达巴德的林加亚大学获得计算机科学工程博士学位。他有8年的教学经验在著名的印度教育工程大学,14年的教学经验在埃塞俄比亚,东非的国外大学和4年的工业经验在印度从事一个系统分析员,系统开发。他目前担任教授(CSE),沃尔凯特大学,SNNPR,沃尔凯特,埃塞俄比亚和东非。他是多个专业团体的会员,包括美国WASET、香港IAEng及埃塞俄比亚CSE。他在著名的国家和国际期刊《会议论文集》上发表过各种论文。他的邮箱地址是prao9039@gmail.com,另一个邮箱地址是raopvlnr2004@yahoo.co.uk。
POTHIREDDY SIVA ABHILASH出生在印度安得拉邦奎师那地区的Vijayawada。他于2013年在英国斯塔福德郡斯塔福德郡大学获得远程通信工程M.S学位。他
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[239558],资料为PDF文档或Word文档,PDF文档可免费转换为Word
