TrigSense:用于交通状况监控的加速度计触发音频传感外文翻译资料

 2021-11-23 10:11

英语原文共 6 页

TrigSense:用于交通状况监控的加速度计触发音频传感

Rohan Banerjee 1,Aniruddha Sinha 2

塔塔咨询服务

印度加尔各答

1 rohan.banerjee@tcs.com

2 aniruddha.s@tcs.com

摘要----鸣笛率与平均车辆运动相结合可以粗略估计发展中国家城市街道的交通状况。最近,(许多研究)使用用户的移动电话进行了很多关于参与式感知的工作。这导致了对移动电话中的电池使用的担忧。在本文中,我们提出了一种用于触发传感的多模式方法,其中低功率传感器用于触发耗电量大的传感器以进行交通状况估计。低功耗传感器(如加速度计)不是打开所有传感器,而是通过应用预定义逻辑来触发高功耗传感器,如麦克风。音频的特征提取在移动设备上完成。包含位置相关信息和时间戳的特征数据和同时生成的元数据xml文件被发布到后端服务器以供进一步处理。提出了一种基于决策树的方法,通过使用喇叭检测来导出(获得)交通状况。根据这些决定,创建和更新交通状况监测申请以供公众访问。实验结果显示了触发音频感应在移动设备上的节能(高达50%)以及减少服务器整体处理方面的有效性。

I. 引言

通过分析各种传感器数据进行交通状况估计是现代流行且具有挑战性的任务,并且已经针对相同的[1] [2] [3]进行了大量工作(研究)。在发展中国家,鸣笛是作为驾驶模式的一部分[4]。基于鸣笛率确定交通拥堵的概念主要适用于发展中国家,其中重度鸣笛是拥挤道路的共同特征。通常,车辆运动在拥挤的交通中非常缓慢,并且由于重型车辆喇叭,噪音水平非常高。因此,加速度计和麦克风可以成为发展中国家交通状况估算的两个非常重要的传感器[9]。

这种设计的主要挑战(问题)在于传感器的最佳定位和分析。其中一种传统方法是分析安装在道路上的传感器,如[4]中所述。然而,安装和维护如此多的路边传感器是一项繁琐的工作。此外,基于少数传感器对整个区域进行决策可能不是一种非常可靠的方法。因此,参与式传感的概念就出现了。这一概念源于过去几年传感器手机的显着改进[5]。目前的手机市场也揭示了这一点:智能手机现在越来越受到人们的欢迎[6]。除了传统的通信设施外,智能手机还配备了各种传感器,如加速度计,陀螺仪,全球定位系统(GPS)等[7]。因此,通过收集和汇总来自类似位置的许多电话传感器的数据,可以对道路,交通和天气条件进行重要估计。该方法解决了安装和监控路边传感器的问题。此外,通过读取多个传感器可以做出决策,这使得方法更加可靠。

参与式传感的挑战在于手机传感器的最佳和有效利用。为了使它们流行,必须确保应用程序使用最少的移动电话资源。在[9]中估计了移动电话传感器的一般功耗,可以清楚地观察到麦克风和GPS等传感器消耗了设备的巨大电池电量。另一方面,加速度计消耗的功率非常低。因此,如果使用连续监视低功耗传感器导出一些逻辑来打开和关闭高功率消耗传感器,则系统的总功耗可以显着降低。基本概念在[9]中给出,但在文献中没有找到这样的实现。

我们提出了一种基于加速度计,麦克风和位置提供传感器的交通状况估计的参与式传感系统。提供传感器的加速度计和位置始终打开,它们将使用预定义逻辑触发麦克风进行音频录制。对于位置估计,我们使用移动设备而不是GPS从相邻小区接收的信号的接收信号强度指示符(RSSI)。虽然它不如GPS准确,但它可以节省大量的电量。准确度水平对于我们的应用是可接受的,因为我们需要粗略估计位置而不是用户的精确纬度和经度。

每次加速度计打开音频录制时,都会生成包含加速度计和位置相关信息的xml元数据文件。录制的音频的特征提取也同时进行。触发器设置为关闭后,提取的要素数据和元数据将发送到服务器。对道路决策的详细音频分析是通过将音频分析结果与xml元数据组合的方式。

对于手机中的音频特征提取,我们使用改进的梅尔频率倒谱系数(MFCC)命名为SBMFCC [16]技术,该技术根据车辆喇叭声音的频谱特性改变传统的梅尔滤波器[10] [11]结构,以获得更好的分辨率。对于分类,我们使用相对于训练模型的最大概率而不是基于阈值的方法,这使得解决方案独立于传感器位置。本文的新颖之处如下:

bull;触发耗电量大的传感器以便有效利用这些传感器的方法,从而降低移动设备的总体功耗。

bull;基于决策树的交通状况监测方法。

系统架构在第II节中给出。第III节给出了客户端移动设备,音频处理和基于决策树的流量监控的触发原理。音频特征提取在第IV节中给出。实验结果在第V节中给出,接着是结论部分。

II.系统架构

我们提出了一种城市范围的传感器网络系统,其中部分处理在用户的移动电话端完成,其余部分在服务器端完成。

整个系统架构可以在两个主要阶段进行广泛分类,即:

bull;用户移动端处理

bull;后端服务器端处理

A.用户移动端处理

应用程序安装在用户移动设备中执行以下操作任务如图1所示。

bull;加速度计始终打开,数据实时采样和聚合。

bull;位置管理器应用程序也在后台,根据手机的无线网络跟踪位置信息。

bull;根据聚合的加速计数据,打开或关闭录音。

bull;实时提取录制的音频。

bull;对于每个音频录制(在开启和关闭触发之间),生成元数据xml文件,其包含位置信息和时间相关信息。使用Android应用程序编程接口(API)从RSSI信息导出位置信息。

bull;压缩音频功能数据以降低数据速率。压缩特征和相应的元数据文件在本地存储在队列中。

bull;存在一个后台进程,用于侦听队列并将压缩的要素数据和xml文件发布到后端服务器以进行进一步处理。

B.后端服务器端的处理

服务器端主要负责喇叭检测的音频处理以及将结果与xml元数据条目组合。在服务器端执行以下任务,如图2所示。

bull;后台进程始终在服务器中运行,等待来自移动设备的压缩功能数据和xml文件。

bull;接收后,压缩的特征数据被解压缩。

bull;喇叭声音的训练模型是服务器中已加载的其他交通声音。这个过程是离线的,一开始只做一次。

bull;将提取的特征与训练模型进行比较,并基于最大概率分数模型进行决策。

bull;最后,将音频处理结果与xml元数据条目组合,并通过使用融合从类似位置的许多传感器收集结果来完成决策。

bull;根据结果,交通条件映射到某些导航应用程序,如“谷歌地图”,供公众使用。

bull;交通状况在服务器中定期更新。

用户可以容易地利用这些应用程序来获得特定时间的位置的交通状况的知识。城市管理员也可以使用这些应用程序来监控整个城市的交通情况。为了生成训练模型,我们收集不同喇叭和非喇叭交流声音的样本,并用它们创建模型。对于训练和测试,我们使用13维SBMFCC [16]作为特征。训练模型使用高斯混合模型(GMM)分类器[11]创建。

我们创建了两个模型,一个用于喇叭,另一个用于非喇叭交流声音。非喇叭交流声音包括发动机怠速噪声,轮胎噪声,空气湍流噪声,人类语音汽车音乐等。基于加速度计数据分析技术和音频特征提取技术的音频捕获触发将在接下来的两节中详细讨论。然而,用于组合多个共同定位的移动设备的决策的融合技术超出了本文的范围。

III.基于加速度计的音频触发

参与者手机的加速度计始终开启并持续处理。基于加速度计数据分析,打开或关闭录音。我们在用例中做出以下假设。

bull;假设携带移动电话的参与者正在乘车。

bull;当车辆处于运动状态时,我们可以假设没有拥堵,因此录音已关闭。

bull;车辆静止时,打开录音。可能存在两种情况 - 车辆在交通信号中停止或由于交通繁忙而停止。

bull;通常,当车辆在交通信号中停车时,按喇叭率较低,因为这是正常现象。然而,当车辆由于交通堵塞而停车时,司机往往会鸣喇叭[8]。因此,通过分析音频中的鸣喇叭率,可以粗略地估计交通拥堵。

bull;车辆开始移动时关闭录音。

移动设备上的3轴加速度计可捕获所有三个轴上的样本。使用等式计算得到的加速度的绝对大小。

通过计算加速度计读数的绝对量值的方差,对每512个样本进行分析。周等人[13]提出了一种通过分析加速度计数据的方差来估计车辆类型的方法。我们应用相同的技术来区分这两种情况 - 静止车辆和车辆运动。得到的曲线如图3所示。这里每个样品箱由512个加速度计读数样本组成。

从结果可以清楚地看出,当车辆处于静止状态时,加速度计数据的方差非常小。然而,当车辆运动时,加速度计数据的方差变高。原因在于,运动中的汽车的速度和加速度都没有固定,并且它们在改变车道,拉动刹车等时突然改变。

基于上述事实,我们提供了基于决策树的方法(图4)用于交通状况监测如下。

bull;计算512个加速度计样本数据的每个bin的方差。

bull;如果值低于L1,则触发录音,特征提取和元数据创建。

bull;在实际情况下,当方差值低于L1时,可能存在两种情况 - 汽车处于静止状态或以均匀的速度运动。

bull;通过观察地理位置将上述两种情况分开。

bull;如果汽车处于运动状态,则两个地理位置很可能不同。

bull;对汽车静止的音频特征进行进一步分析,以得出交通状况。

IV.音频特征提取

当在移动电话上触发音频录制时,使用SBMFCC [16]的相应特征提取也在本地设备中完成。

传统的Mel滤波器组在较低频率下具有高分辨率,但在较高频率区域具有较低分辨率。

这个语音和说话人识别是一种高度接受的方法,因为语音信号主要产生500 Hz和1500 Hz之间的峰值。另一方面,喇叭信号在较高频率区域(通常为2-4KHz)主要具有峰值。因此传统的梅尔滤波器不能成为喇叭检测相关应用的非常好的方法。还有另一种方法可以反转Mel滤波器的结构,以便在较高频率分量下提供比低频分量更好的分辨率[10,12],称为逆Mel滤波器组结构。上述滤波器的频谱表示分别如图5(a)和5(b)所示。

水平轴给出DFT点,垂直轴给出归一化幅度。然而在实际情况下,喇叭信号的频谱能量并不总是集中在固定区域。在某些情况下(在玻璃窗关闭的汽车内录制),喇叭信号的峰值在2KHz以下产生。对于这些情况,逆向MFCC的表现急剧下降。因此,应考虑声音的光谱能量分布的变化性质。SBMFCC [16]方法将完整的喇叭频谱划分为几个频段。计算每个频带的频谱能量,并将对应于最大能量的频带称为主频带。选择主频带的中间作为该主带中的主峰值频率(fpeak)。传统的Mel滤波器组以主峰值频率移动,使得它占据从主峰值频率(fpeak)到信号的最大频率(fmax)的频率范围。用于该修改的控制方程如公式2所示。其中fpeakle;fle;fmax。

类似地,反Mel滤波器组也移位主导峰值频率,使得其范围从信号的最小频率(fmin)到主峰值频率(fpeak)。用于此的等式在方程式3中给出。其中fminle;fle;fpeak。

最后,SBMFCC滤波器组是通过组合移位的常规和反Mel滤波器构成的,如图6所示。这里我们 已经考虑了512点离散傅立叶变换(DFT),用于100毫秒的声音帧,采样频率为8 KHz。主要光谱能带为2-3KHz,fpeak为2.5KHz。这里fmin对应于0Hz,fmax对应于4KHz。

V.实验结果

我们已经为Android智能手机创建了客户端应用程序并成功部署在索尼Xperia Sola(MT27i)和华为Sonic(U8650)Android手机上都有操作系统版本 2.3.7。电话的详细规格分别见[14],[15]。该服务器是一台PC,运行流行的Apache Tomcat(6.0.35)应用服务器。为了将文件发布到服务器,我们使用HTTP post方法,并使用通用分组无线服务(GPRS)向电话提供互联网连接。我们的实验结果大致分为四个部分。

bull;比较触发录音和恒定录音之间的功耗。

bull;研究录音开启和关闭的准确性。

bull;使用SBMFCC研究喇叭检测的准确性。

bull;分析带宽使用情况。

A. 改善通过恒定音频记录触发音频记录的功耗

为此我们创建了另一个类似的Android应用程序,但它不是从加速度计触发,而是连续捕获音频以及加速度计数据处理和位置跟踪。此应用程序运行一个小时。接下来,我们针对不同的交通条件,每次运行实际触发的录音应用程序三次,每次一小时。所有测试均在Sony Xperia Sola手机上进行。每次手机电池在测试开始前充电至100%。在每小时运行一小时后,记录电池百分比水平,这有效地给出了功耗信息。图7显示了各种条件下的功耗结果。图中较低的是在一小时测试期间消耗的电池。与拥挤的交通流量相比,自由流量交通的能耗较低,因为自由道路中触发音频的持续时间较短。在所有类型的交通状况下,连续音频消耗的电池与触发模式相比是最差的。从图7中可以看出,经过一小时的测试后,连续音频的电池电量降低了23%(100-77),而自由飞行的触发音频降低了13%(100-87)。这表明在最好的情况下节电可以接近50%。因此,触发的音频感测在整体功率节省中的效果是合理的。

B.开启和关闭音频录制的准确性

我们使用前一个实验中使用的相同两个应用程序进行了研究。两个应

原文和译文剩余内容已隐藏,您需要先支付 20元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。