基于图像的人体坐姿测量系统的验证外文翻译资料

 2022-08-09 10:08

英语原文共 29 页,剩余内容已隐藏,支付完成后下载完整资料


基于图像的人体坐姿测量系统的验证

摘要

一九九六年,DCIEM进行了一项初步研究,以探讨利用电脑控制的数码相机,在自动配对的基础上取得准确的人体测量数据的可行性。这个系统经历了几个发展阶段,最终形成了一个商用的系统,称为BoSS XXI(身体扫描系统)。对BoSS XXI系统的前身(智能服装与设备尺寸测量系统(ICESS))的验证研究表明,直接线性测量的精度和精度足够高,可以将这项技术应用到坐姿测量中。

第一次开发迭代演示了使用BoSS XXI技术执行坐姿测量的可行性,但是一些用于眼睛定位的算法的性能并不令人满意。该次尝试中确定的问题在第二次迭代中得到了解决,正如本报告中公布的结果所示。验证研究涉及到53名受试者:28名男性,25名女性。比较坐姿高度、眼高、肩峰高、膝高和臀膝长的人工和自动测量值。结果表明,所有专家手工测量和自动测量的变量之间的相关性比0.95更大,并认为MAD(平均绝对差)的范围从4毫米到8毫米,除一个变量外,其余均在最大允许测量误差范围内。

方法

硬件

坐姿测量系统由两个奥林巴斯Camedia c - 4000分辨率为1280 x 960像素的相机,与一个嵌入式校准标记蓝色的背景,和一台电脑(图1)组成。如图2所示,系统需要同时拍摄一个人坐在一张配有可调节脚凳的长凳上的前面和侧面的照片。

数码相机设置在距离坐姿展台后面板约4米的地方。摄像机设置在离地面约1米的地方。BoSS-21软件的默认设置用于摄像机的操作和校准。每天在测试前和测试后两到三小时不活动的情况下对摄像机进行校准。

图二 侧视图

观察者的培训

两名观察员,一男一女,接受了使用传统人体测量仪器进行测量的训练。这些测量是根据1997年陆军调查(Chamberland et al.,1998)中描述的定义进行的。男性由男性观察者标记和测量,女性由女性观察者测量。

两项测量都是在同一周同一天同一时间对同一个人进行评估,以证明观察者内部和观察者之间的可变性是可接受的,以证明技术不存在随时间变化。每个测量者对每个变量进行10次交替测量,以防止随时间的轻微姿势变化影响结果。表1总结了观察者的性能在训练阶段(1 - 4周)和试验期间(周5 - 7)。在试验期间,除了一个变量意外,所有观察者的测量误差都在允许范围之内,他们之间只有0.1厘米的距离。

测试协议

(1)填写同意书及薪酬表

(2)在测试开始前询问受试者是否有任何问题

(3)受试者换上提供的绿色作战内裤、红色泳帽和红色运动胸罩(女性受试者)

(4)用笔在受检者身上画三个标志点,(1)髌骨顶部股四头肌放松,(2)面部侧面与眼角对齐,(3)肩峰突顶部

(5)传统测量的变量依次为:身高、跪高、功能腿长、坐膝高、坐肩峰高、坐眼高、坐膝高、坐膝长。受试者被要求坐直,直视前方,手臂保持90度。一张正确姿势的照片被放置在前摄像头的上方,以便被试者作为向导和直视前方的目标。在每次测量之间,受试者可以放松他们的姿势。

(6)受试者以正确的姿势拍照

(7)提供酒精棉签和镜子,让受试者移走笔标

(8)受试者换上街头服装/制服,并向他们提供一份成绩

讨论

本验证研究的结果显示,被测者所测得的数据与自动化系统所测得的数据之间存在密切的对应关系,相关系数在0.95到0.99之间。毫不奇怪,在地标很容易转换成计算机算法的情况下,相关性最高;坐高和臀膝长度属于这一类,相关系数约为0.99。另一方面,通过图像处理技术很难甚至有时不可能找到骨性标志,因此,与人工测量相比,其误差更大。这可能是肩峰高度和膝高坐姿相关性略低的主要原因之一(Pearson r值为0.95 ~ 0.98)。

眼高坐姿算法表现良好,男性和女性数据的Pearson相关系数分别为0.96和0.97。然而,还有改进的空间,因为它只能在大约75%的时间里正确识别眼睛。眼睛定位算法的改进是可能的,并且应该尽快实施,以达到系统能够达到的精度。需要注意的是,系统操作员可以交互地移动任何错位的地标,只需在图像处理后单击鼠标即可。虽然这个方法总是可以进行的,但从长远来看,改进算法比依赖于操作者的参与更可取。

作为表征系统整体性能的一种方法,我们计算了每个人体测量变量人工测量和自

动测量的平均绝对差(MAD),并将其与每个维度的最大允许误差(MAE)进行了比较。最

大允许误差的概念与人体测量中观察者间和观察者内的误差有关,误差是人体测量中

难以消除的累赘。但是,有了良好的经验和实践,就有可能将错误的程度降到最低。

每个维度在准确性和精度方面都有自己的挑战,可能是由于地标性软组织变形、呼吸

姿势等。因此,每一个都需要单独评估。戈登等人,1989)发表了一套这样的限制变

量测量的方法在美国陆军调查,以控制收集的数据质量。该报告中所列的和在上述讨

论中所使用的最大可接受误差反映了训练有素的观察员所能达到的水平,以及人们在

数据中所需要接受的误差水平。

还必须记住,MAE值可能具有实际意义,也可能不具有实际意义,这取决于给定

总体中的维度可变性或应用程序对错误的容忍度。当日变化可达2至3厘米时,测量

1毫米内身高的能力就没有什么意义了(NASA, 1978)。

结果显示在图8中,所有的测量结果都在MAE范围内,除了膝盖的高度。这个变量存在差异的原因有两个。首先,列出的膝高坐姿MAE不包括标记错误,这也是其他列出的MAEs中存在的情况。因此,0.2 cm的低MAE值更大程度上反映了一旦出现一个标志,测量该变量的容易程度,因为它相对来说没有常见的误差来源,如组织压缩,姿势等。其次对于自动化系统来说,标记到膝盖是非常困难的。例如,人工测量依赖于受试者站立时的超触觉标志的位置和标记。当受试者坐下时,随着膝盖处皮肤的拉伸,标志似乎随着股骨和胫骨移动。这一动作的幅度因人而异,这意味着标志的位置取决于大腿的基本形状,进而延伸到测量本身。但由于地标本身是清晰可见的,观察者可以非常准确地测量。

基于图像的系统依靠形状和/或颜色来识别标志。对于膝盖来说,形状和颜色都不是一个能够识别这个标志的可靠方法,因为在这个区域缺乏特征,除非一个颜色点可以被贴上来定位它。图9用两种不同的膝盖形状说明了问题的本质。可以看出,对于左侧的受试者,膝关节置顶的轻微水平错位对膝关节高度测量的影响很小,甚至没有影响。对于右边的受试者,同样的错位也会对膝盖高度产生显著影响。有人认为,如果在手工测量中加入标记误差,MADs将具有可比性。总的来说,手动和自动测量(4-5毫米)之间的平均差异从实用的角度来看是可以接受的。

结论和建议

这项验证研究的结果表明,为测量坐姿而开发的基于图像的人体测量系统产生的测量精度可与训练有素的观察者相媲美,为飞行员选择等应用打开了大门。

虽然系统操作员可以交互地纠正标志错误,但建议对眼睛定位算法进行改进,以最小化这一关键变量上的测量误差。同时,应增加被测变量的数量,以满足试点选择过程的需要。这些额外的变量是腰围深度和臀宽。

人体姿势警报和活动汇总系统

摘要

在本文中,我们提出了一种新颖的系统,用于监视计算机用户在计算机前的姿势和活动(例如,阅读,在电话中讲话等)以进行自我报告。在我们的系统中,照相机和麦克风位于计算机工作区的前面(例如,在计算机屏幕的顶部)。该系统监视计算机用户的姿势并总结其活动。该系统为用户提供有关其当前姿势是否良好的实时反馈,如果姿势不是好姿势则触发警报,并在指定的时间段(例如,小时,天,月)等中生成姿势和活动的摘要。系统的所有元素都是高度可定制的:用户决定什么是“好”姿势,触发了哪些警报(如果有的话)以及生成了哪些活动和姿势摘要。我们提出了用于姿势测量(使用用户轮廓的几何特征)和活动分类(使用机器学习)的新颖算法。最后,我们提供了表明我们方法可行的实验,并讨论了隐私问题和所介绍技术(健康监控,生产力分析等)的应用。

介绍

强调系统的两个方面很重要:灵活性和隐私。首先,目标是让用户完全控制定义好或坏的姿势,并确定何时触发警报(如果有的话)以及总结中应包括哪些活动。其次,该系统用于自我报告:即姿势和活动监视是私人的,而不是监视的一种形式(这将在后续部分中进一步讨论)。

我们的方法使用背景减法提取轮廓。从轮廓中我们获得垂直投影以将头部与躯干分开,并提取几何特征以对活动进行分类。通过获取头和肩的角度来测量姿势。我们使用来自麦克风的输入来确定某人何时说话,何时静音或何时使用键盘。使用音频,我们可以区分视觉上相似的活动。尽管已经开发了许多姿势算法,但这是我们意识到的第一个基于摄像头的用于姿势监控的系统。

问题定义

我们试图解决的问题有两个方面。一方面,该系统在用户的姿势不合适时向用户发出警报。姿势是指他坐在电脑前的上半身的位置。另一方面,目标是使系统生成用户在其工作空间中活动的总结。

姿势:由于每个用户都不相同,因此系统无法使用一项“万事通”措施自动确定哪种姿势好。因此,用户必须确定什么是良好(或舒适)姿势,并给出这些姿势的系统示例。如实践中所做的那样,用户可以在决定哪种姿势被认为是正面的和哪些姿势被认为是负面的之前,咨询专家(“人体工程学顾问”评估一个人的工作空间和姿势并提出改进建议并不少见)。该系统的目标是根据用户的姿势偏好向其提供不干扰用户的实时反馈,并生成总结。警报由用户设置,因此不会引起干扰。

视觉处理概述

该系统基于背景减法算法。初始化时获得的背景图像用于每毫秒执行背景扣除(这取决于所使用的特定硬件)。这产生了对其施加阈值的图像以获得与前景对象相对应的二进制图像。

阴影有时会成问题,特别是如果用户坐在靠近背景(例如墙)的地方,因为用户的移动可能会导致场景中的照明发生变化。为了提高鲁棒性,我们使用基于规则的皮肤检测器。二进制图像中还包括与皮肤相对应且根据第二(较低)阈值与背景像素不同的像素。我们通过实验发现,添加此约束可以改善用户与背景的分离度,并且不会影响其他运动区域(例如,衣服覆盖的身体)的检测。

下一步是对二值图像执行形态学操作(腐蚀,填充和扩张),以消除孔洞并降低噪声。该过程可能会产生多个区域,因此我们使用连接组件算法标记区域。因为我们假设在大多数情况下唯一的移动对象将是用户,所以我们继续处理仅获得的最大区域,该区域大致对应于用户的轮廓。除极少数情况(例如,非常相似的背景像素和前景像素)外,只要照明条件恒定且选择了适当的阈值,用户将产生一个区域。

接下来,我们提取区域的边界框和以下区域特征:边界框宽度,边界框长度,边界框x和y位置,区域质心,区域周长,区域面积,区域主轴角度,长度区域主轴,区域次轴长度,费雷特直径(沿区域边界的任意两点之间的最大距离)以及区域偏心率。在训练过程中,学习算法会使用这些功能,而在监控活动分类时,会使用分类器来使用这些功能。如果当前活动被确定为“坐在电脑前”,我们将提取其他视觉特征以测量姿势。

特征提取

如前一节所述,一旦选择了最大区域,系统将提取以下几个特征:

1. 对于该区域,提取边界框宽度,边界框长度,边界框x和y位置,质心,周长,面积,主轴角度,主轴长度, 副轴长度,费雷特直径和偏心距。

2. 绘制以质心为起点的n条线,并以相等的角度增量分开(例如,对于45°的角度,我们获得8条线)。

3. 对于每条线,找到该区域的外部边界。这些点定义了用于活动分类的多边形。

训练与分类

用户通过显示好姿势和坏姿势的示例以及他的常见活动的示例来训练系统。这样做是因为只有用户才能使用推荐的人体工程学准则或他自己的偏好来真正确定自己认为良好(或舒适)的姿势。每个人在办公桌旁执行的活动类型也可能有所不同,因此用户还可以决定要包括哪些活动。在训练期间,用户只需单击界面上的按钮即可指示给定的姿势是“好”还是“坏”。对于活动,用户标记每个活动的示例 (例如,在电话上,阅读中等)。

对于每个示例,我们获得最大的区域并提取刚才描述的特征:边界框宽度,边界框长度,边界框x和y位置,区域质心,区域周长,区域面积,主区域轴角度,长度主要区域轴的长度,次要区域轴的长度,费雷特直径(沿区域边界的任意两个点之间的最大距离)和偏心距。然后,将这些特征与源自质心的每条线的长度连接起来,并获得每个示例的n维特征向量fv = {f1,f2,hellip;,fn )}。例如,如果我们使用距质心的16条线,29个要素(16个线长加上所描述的13个要素)。由于多边形顶点足以区分某些活动,因此此度量存在一些冗余。

此过程产生了几套训练示例,每个课程一个训练示例(例如,在电话上,伸展运动,仅坐着等)。然后,通过机器学习算法(例如,最近邻居)使用特征向量来学习n类分类器 (例如,阅读,在电话上,仅坐着等)。

姿势测量

在我们的系统中,我们仅对当用户处于仅坐姿时的实时反馈感兴趣(不执行其他活动,例如使用电话)。前两个姿势可以被认为是“正确的”姿势(根据用

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[239611],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。