基于FPGA的语音识别到手势图像显示系统外文翻译资料

 2021-11-25 10:11

英语原文共 11 页

介绍

教师和研究人员经常使用术语流畅性来描述母语和非母语的表现。流畅性是一种经常应用的概念,这一事实可能表明人们对其准确含义存在普遍的一致意见。然而,对相关文献的回顾表明,流利性一词被用来指代各种不同的技能和不同的言语特征(例如,Leeson,1975; Fillmore,1979; Brumfit,1984; Lennon,1990;施密特,1992年;钱伯斯,1997年)。

尽管存在这种巨大的变化,但在两个方面存在普遍的一致意见。首先,虽然很明显流利性可以用来描述书面表现(Len-non,1990),但大多数作者都将该术语的使用局限于口头形态。此外,尽管一些作者已经明确了流利相关因素在接受过程中的重要性(Leeson,1975; Segalowitz,1991),但教师和研究者之间似乎存在一种默契,即流利主要指生产性语言表现。 然而,即使是作为口头生产描述的流利性的这种更受限制的定义也适用于不同的解释。

在考虑各种可能性时,我们可以区分流利语与母语表现和流利语在外语教学和测试中的区别。在后一种情况下,流利被视为一种重要的标准,通过该标准可以判断非原生表现(Riggenbach,1991),尽管该概念的确切含义模糊不清。这一点很清楚,流利性通常包含在测试和评估方案中。对于母语人士的口语表现,流利程度可用于表征说话人的表现,但并不真正构成评价标准。

另一方面,术语“不流畅”常常与某些言语障碍有关,如口吃,其中流畅的言语的特点是“语音向前流动的异常高频率和/或停止持续时间”(彼得斯和吉他,1991年)。

在考虑母语人士的口头生产时,Fillmore(1979)确定了四种不同的能力,这些能力可以在流畅性一词下得到消解:

(a)能够长时间说话,几乎没有停顿,

(b)能力用连贯的,合理的,和语义密集的句子来说话,

(c)能够在广泛的语境中说出适当的话,

(d)能力在语言使用方面具有创造力和想象力。

在外语教学和测试中,还发现了各种流利的定义。例如,在交际语言教学中,重点在于流利性而不是准确性。根据Brumfit(1984,第57页)提供的定义,流利性是“迄今为止学生获得的语言系统的最大有效运作。”在这种流畅性的定义中,类似母语的人形成并不构成要实现的目标(Brumfit,1984,p.56)。或者,本地表演被视为流利语作为口语命令的同义词的更常见解释的最终目标。在日常语言使用中,可以扩展该定义以指示总体语言熟练程度(Lennon,1990; Cham- bers,1997)。最后,在更严格的意义上,术语流行性被用来指口语能力的一个方面,特别是时间方面(Nation,1989; Lennon,1990; Riggenbach,1991; Schmidt,1992; Freed,1995 ; Towel等,1996)。然而,即使在这种更有限的意义上使用流畅性一词时,仍然存在关于确切流利性究竟有什么贡献的不确定性。正是这种对流利性的时间解释相当模糊,这将成为本文的重点。

在试图定义流畅性的时间方面时,人们常常认为语言学习的目标是在母语人士的节奏下产生“语音”,不受静音停顿和犹豫,完全停顿纠正,重复错误开始等等(Lennon,1990)。然而,对暂停相关现象的定量研究表明,本土语言并不总是平滑和连续的,但表现出许多犹豫和修复(Raupach,1983; Lennon,1990; Riggen-bach,1991)。这似乎意味着犹豫现象的存在不足以区分本地人和非本地人,并且差异恰恰在于这些现象的频率和分布,正如Mouml;hle(1984)所建议的那样。事实上,在同一发言者的L1和L2语音中比较了许多定量流畅性测量的研究表明,两种语言类型之间可能存在相当大的差异(Mohle,1984; Towell等, 1996年)。

为了更深入地了解流畅性的时间方面,Lennon(1990),Riggenbach(1991)和Freed(1995)进行了一些研究,其中由非英语母语人士制作的自发言论样本被评判由流利专家组成,然后根据定量变量进行分析,如语速,发声-时间比,平均跑步长度,停顿次数和长度。这些研究的结果表明,流量等级受到诸如语速和暂停次数等量变量的影响。此外,这些研究还表明,研究流利评级与自发言语中的时间变量之间的关系可能相当复杂,因为在这种情况下,流利评级结果会受到语法等非语言属性的影响,例如语法,词汇和口音(Lennon,1990; Riggenbach,1991; Freed,1995)。

本文报道的研究目的是确定是否可以根据语音质量的时间测量来预测阅读语言的专家流畅度等级。限制此调查以阅读语音的决定与研究自发语言流利性所涉及的方法复杂性有关。如果目前的方法似乎是可行的,那么它也将适用于自发语音。识别感知流畅性的定量相关性对于开发流畅性评估的客观测试工具非常重要。本研究的一个重要特征是定量变量是自动计算的。反过来,这表明如果本研究中使用的客观测量似乎能够预测流畅度,那么这种方法可能有可能在阅读语言中开发流畅性的自动测试。

本研究的目标将通过将荷兰本地和非母语人士阅读的语音专家流利度评分与一系列与感知流畅性相关的语音质量量化指标联系起来来实现。以这种方式,可以确定在自动获得的语音质量的时间测量的基础上可以预测流畅性的专家判断的程度。

换句话说,专家流畅度等级将构成评估自动流畅度测量的参考。当然,只有专家评分表现出可接受的可靠性水平才有可能实现。为此,我们将要求不同的评估者群体评估相同的流利性材料。此外,每个评估者将被要求对材料的一部分进行两次评分,以便可以建立可靠性。

此外,这些分析可以确定各种定量变量对感知流畅性的贡献。反过来,这将阐明阅读语言中流畅性的决定因素。

此外,由于本次调查中收集的数据涉及本地人和非本地人,因此可以确定本地和非本地说话者在流畅度等级和时间变量方面是否存在差异。很明显,区分这两个群体并不是流畅性测试的目的,而是应该在流利和非流利的发言者之间进行区分。但是,对于这种测试的开发,有关本地性能的数据对于建立基准是必要的。此外,鉴于流利性通常等同于本地性能(见上文),确定两组本地人和非本地人是否在所研究的变量上显着不同是有趣的。

I.方法

A.演讲者

参与此实验的演讲者是60名非母语人士(NNS)和20名母语为荷兰语(NS)的人。 60 NNS全部住在荷兰,并参加或曾参加过荷兰语作为第二语言的课程。他们被选中以获得在母语,熟练程度和性别方面充分变化的群体。表显示了如何根据这三个变量分配60个非母语人士。关于此表的一些评论是有序的。首先,“初学者”类别的演讲者已经参加了几个月的课程。这被认为是学习者能够阅读句子所必需的。其次,从该表中可以清楚地看出,发言者并不是均匀分布在各类别上。这与发言人的可用性有关。即使可以为每个类别找到相同数量的发言者,也必须做好准备,并且必须找到时间来执行任务。因此,最终,有更多的女性和更多的中级和高级水平的发言者。此外,各种母语群体的发言人人数不同。但很明显,为了本实验的目的,实际上并不需要样本中的完全对称性。

四名NS科目,两名男性和两名女性,是荷兰标准品种(SDS:标准荷兰语演讲者)的演讲者,而其他16名NS则以荷兰语为特色,选择获得异质体 - 关于原产地和性别的群体。包括四个SDS背后的基本原理是,明确的“锚定刺激”的存在已被证明是保持参考标准稳定的重要帮助(Flege和Fletcher,1994)。但是,我们不希望SDS和NS在流畅性方面有所不同,因此在分析中,它们将被视为一组母语人士。

B.演讲材料

每个发言者阅读两组不同的五个语音丰富的句子,分别为第1组和第2组(见附录)。在准备句子时,采用了以下标准:

(i)句子应该是有意义的,听起来不应该是奇怪的;

(ii)句子不应包含NNS不太可能熟悉的异常词汇,外来词或名称,或特别难以发音的长词或复词;

(iii)句子的内容应尽可能保持中立。例如,句子不应包含有关特定国家或国籍特征的陈述;

(iv)每组五个句子应包含至少一次荷兰语的所有音素。

每组的平均持续时间为30秒。有两组,每个发言者的讲话时间为1分钟。所有发言者都通过电话阅读相同的句子。要阅读的句子与说明书一起印在纸上。因此,在通过电话阅读句子之前,受试者有可能进行排练。没有明确鼓励他们这样做,但由于他们事先收到了材料,他们有机会重新训练。而且,如果他们觉得出了什么问题,他们有可能重新开始录音。但是,这只发生在一起案件中。

由于记录系统连接到ISDN线路,输入信号由8-kHz 8位A-law编码样本组成。允许受试者从他们的家,电话亭或第一作者的办公室打电话。两个主体采用后者的可能性,而所有其他主体则从他们的家中呼叫。由于录音没有在声音处理的展位中进行,因此录音条件与录音室的录音条件不同。

在用于实验之前,检查所有语音材料并进行正交转录。虽然阅读语音应该事先知道句子的内容,不能确定说话者是否会准确读出纸上的内容。此外,发言者可以重复部分单词或句子,并进行重新启动和修复。

在抄录材料时,特殊符号被用于四类非超声波声学事件,

(a)填补暂停:呃,呃,mm等

(b)扬声器噪音:嘴唇发红,喉咙清澈,舌头咔哒声等。

(c)间歇性噪音:在通话期间偶然发生的噪音,例如门砰砰声和纸张沙沙声。

(d)静止噪声:具有相当稳定的幅度谱的连续背景噪声,例如道路噪声或信道噪声。

重复,重新启动和修复完全按照它们的发音进行转录。转录是在SPEX(SPEX)进行的,SPEX是一个专门从事数据库构建和验证的大学专业中心。

C.评价者

由于在这个实验中必须评估语音产生的一个特定方面,因此需要具有高水平专业知识的评估者。不同类别的评估者似乎有资格成为专家:语音学家,因为他们一般都是发音专家;荷兰语作为第二语言(L2)的教师有明显的原因。然而,事实证明,在实践中,学习荷兰语为L2的人的发音问题(包括所有流利相关的时间现象)通常不是由语言教师解决,而是由经过专门训练的语言治疗师解决。由于评级可能随着专家的背景而变化,因此选择了一组三个语音学家和一组三个语言治疗师,他们是荷兰二语学习者发音问题的专家。

此外,由于先前的研究表明专家流利率的可靠性相当低(Len-non,1990; Riggenbach,1991; Freed,1995),我们决定增加第三组专家以获得更多有关其程度的信息。可达到的可靠性。事实证明,找到语言治疗师来完成这项任务比找到语音学家更容易,因此第三组专家由三名其他语言治疗师组成,他们是荷兰语第二语言学习者发音问题的专家。

D.专家流利度评级

如下所述,语音材料在DAT磁带上从盘上转移,对不同的评估者采用不同的顺序。所有评估者都听取了演讲材料并对其进行了单独评估。这样做是为了增强灵活性(每个评估者因此可以在最合适的时间执行任务)并避免评估者相互影响。

每个评估者收到两个磁带,分别包含第1组和第2组句子。该材料的评分范围为1到10.评分不是分配给每个单独的句子,而是分配给每组五个语音丰富的句子。没有具体说明如何评估流利程度。然而,在开始评估之前,每个评估者都听取了五个不同发言者所说的五组句子,这些句子旨在使评估者熟悉他们必须执行的任务,并帮助他们锚定评级。事实上,选出五位发言者是为了表明评估者可能期望的范围。

由于不可能让所有评估者对所有发言者进行评分(这会花费太多时间而且对于评分者而言太累了),80名发言者按比例分配给每组中的三名评估者。每个评估者被分配了20个NNS,6个具有区域口音的NS(因为这些发言者中只有16个,其中2个由两个评分者而不是一个评分者评分)和所有4个标准品种的发言者。对于每个发言者,必须评估两组句子(组1和组2),这为每个听众制作60组五个句子。此外,增加了36个集合,以计算内部可靠性和评估者之间的可靠性。

在为评估者分配发言人时,我们考虑了选择变量,以避免使用一个性别,L1或熟练程度的发言人来超载评估者。表二说明了发言者在各种评估者中的分配方式。每个评估者得到相同的20个NNS,相同的6个NS和所有4个SDS两次,一次用于第1组句子,一次用于第2组句子,因此每个句子组得到30个得分。扬声器在两个句子组中以不同的随机顺序呈现,以最小化对分数的可能的排序效果。然而,定期呈现四个SDS,以便提醒评估者如何用标准语言发出句子,如上所述(另见Flege和Fletcher,1994)。在表II中,通过区分三组20个NNS(每个评估者一个),即20个NNS1,20个NNS2,20个NNS3和3个组6个NS,6个NS1,6个NS2和6个NS3来阐明发言者的分布。 。由于四个SDS由一组中的所有三个评分者评分,对于组1和组2的句子,对于所有三个评价者,在表II中使用相同的标签4 SDS。随后将评估者分配给该部分材料的分数与针对相同材料计算的自动测量值进行比较。因此,该材料将被称为人机比较材料。

选择36个用于计算评估者间和评估者内部可靠性的句子集,以便具有一组平衡的NNS和NS以及第1组和第2组句子。由四个SDS产生的句子集也包含在评估者之间的可靠性分析中,因为他们已经被一组中的所有三个评分者评分。因此,我们不需要添加额外的SDS句子集。最后,我们选择了27个NNS组和9个NS组和18组1组和18组2组,如表II所示,在添加的材料下。选择第1组和第14组的13 NNS和5个NS组以及为第2组选择的4个NS组对于所有评估者都是相同的,因此标签13 NNSA(dded)1(组1),5 NSA1 ,14个NNSA2和4个NSA2在表II中用于所有评估者。

最终用于评估者间可靠性分析的句子数量为每个评估者44个(36个额外加上组1的4个SDS和组2的4个SDS,表II中用斜体表示),即132个所有三个评估者,如表II底行的斜体单元所示。

另一方面,对于内部可靠性分析,为每个评估者选择在人机比较材料和评估者间可

原文和译文剩余内容已隐藏,您需要先支付 20元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。