基于随机森林算法的船舶事故分析预测研究外文翻译资料

 2022-07-25 02:07

英语原文共 5 页,剩余内容已隐藏,支付完成后下载完整资料


基于因子分析和GA-SVM的船舶碰撞事故分析研究

摘 要: 在船舶碰撞事故分析中,针对现有模型的不足提出了一种基于数据挖掘的船舶碰撞事故分析预测模型。首先对收集的船舶碰撞事故报告筛选整理,建立影响船舶碰撞严重程度指标体系,然后运用因子分析方法对指标进行降维,去除数据间的相关性,最后运用Logistic回归分析确定各指标对船舶碰撞严重性的影响程度;结合遗传算法(GA)优化支持向量机(SVM)模型实现对船舶碰撞严重程度的预测。通过与另外三种相似模型进行比较,结果表明GA-SVM联合预测模型具有更高的预测能力,可为事故结果判定提供参考。

关键词: 船舶碰撞;数据挖掘;因子分析;SVM;GA

引言

在水上交通事故类型中,碰撞事故一直占据主导地位。据《长江海事局2014年安全形势通报》显示,2010年至2014年,其管辖区域发生877起水上交通事故,其中碰撞事故410起,占总事故数46.75%。交通管理机关一直探索如何制定有效措施去减少碰撞事故特别是严重事故的发生。

船舶碰撞事故分析模型是基于船舶自身特征如船舶类型、船舶速度、碰撞角度等,来研究船舶碰撞机理和主要致因因素,有利于揭示碰撞内在规律,减少事故发生。目前对于碰撞事故的研究方法主要包括故障树分析、模糊聚类、灰色系统和回归分析等。Li等[1]通过建立船舶碰撞事故树模型,对船舶碰撞的危险因素的重要程度进行了排序。邬惠国等[2]通过仿真技术对船舶碰撞过程进行行动模拟,计算出最近会遇距离和时间,运用模糊聚类分析方法建立船舶碰撞危险度模型,为船舶正确避碰提供参考。李杰等[3]通过对原始碰撞数据优化,构建了新的船舶交通事故灰色预测模型,并对船舶交通事故量做了短期预测。文献[4]运用层次分析法确定了船舶碰撞危险因素的权重。Haris等[5]通过研究船舶相互作用力和碰撞形变得到了三种船舶碰撞类型。由于Logistic回归分析方法避开了分类变量分布问题,在交通碰撞事故分析中已有广泛的应用[6-8]。特别在文献[7]中,通过建造船舶碰撞事故Logistic回归模型,得出船舶总吨比、碰撞位置、被撞船舶速度、碰撞角度四个因素对于船舶碰撞事故严重程度影响最大,并且预测了在上述影响因素下的船舶碰撞结果。随着人工智能算法的不断发展,出现了以支持向量机[9]、神经网络[10]等为基础的交通碰撞事故分析模型。

但现有模型存在以下问题:1)碰撞事故影响因素选取上大多是针对单一特征因素,如船舶尺寸,缺乏多因素的综合研究。2)输入变量个数较多,并且变量之间存在一定的相关性,重复冗余信息较多。使用文献[7]的Logistic回归模型得到的四个主要因素并不能很好解释全部因素信息,容易产生欠拟合,预测分类精度不高。3)以往模型中,大部分将事故分为两类,如死亡事故和非死亡事故,缺乏多分类模型在船舶碰撞事故分析中的应用。

对此,本文提出一种新的基于数据挖掘的船舶碰撞事故分析预测模型,运用因子分析法从众多危险因素中提取主因子,去除因素间相关性;通过对主因子的分析得到船舶碰撞致因要素;使用优化的支持向量机模型实现船舶碰撞程度二分类和多分类船舶碰撞严重程度预测。

相关原理

本文主要运用因子分析和遗传优化支持向量机来分析和预测船舶碰撞严重程度。相关算法原理简要介绍如下。

2.1 因子分析

因子分析(Factor Analysis; FA)其目的是用少数几个因子去描述多个因素之间的关系。数学表达式可以表示为

(1)

其中:为相关变量矩阵,表示主因子矩阵,为因子载荷矩阵,载荷矩阵表明了各个主因子同原始变量的相关性,是特殊因子。

因子模型关键是如何确定因子载荷矩阵,主成分法是其主要求解方法。

因子分析目的是降维,用少数因子表示原数据大部分信息。在因子分析后可以使用回归分析进行下一步的分析。

2.2 支持向量机

支持向量机(Support Vector Machine; SVM)是建立一个分离超平面作为决策曲面的模型。这个超平面满足两边类别边缘最大化,以实现结构风险的最小化。分类函数可以表示为

(2)

其中:为SVM模型输入,是权重向量,为常数,为核函数。

当核函数采用具有很强的非线性分类性能的径向基(RBF)核函数时,SVM将存在惩罚参数和核函数系数,这些参数的取值对SVM模型预测能力有很大的影响。遗传算法(Genetic Algorithm; GA)是一种以生物进化为原型的优化算法,具有很强的全局搜索能力,且不依赖特定的求解模型,为解决SVM的参数选取问题提供了有效的途径。

船舶碰撞事故分析预测模型

3.1 数据提取与量化

船舶碰撞数据来源于中华人民共和国海事局、直属海事机构和地方海事局公开的船舶碰撞事故报告。收集一共183篇,依据详实性、广泛性、权威性等原则选取其中136篇包含两船碰撞完整信息的事故报告建立数据库。

事故报告中的信息,如碰撞方位时间,船舶静态信息,船舶动态信息和环境信息等,记录于助航设备中,均是客观准确的数据。对于船舶管理信息,如船舶是否瞭望、驾驶人员等记录是由多个船员回忆后综合判定。事故报告真实记录了船舶受损情况,人员伤亡和直接经济损失情况,根据《水上交通事故统计办法》可以判定事故等级。因此,建立的船舶碰撞事故数据库内容完整、信息真实可信。

船舶碰撞程度与船舶碰撞时刻的状态密切相关,本文选取18个碰撞指标如表1所示,其中驾驶人员、船舶类型、船舶吨位以及船长包括两个变量,第一个变量指的是事故报告中的两个当事船舶中的大船,第二个变量为小船。根据《水上交通事故统计办法》,将重大事故、大事故作为严重事故,将一般事故、小事故作为不严重事故。其中重大事故55起,大事故29起,一般事故30起,小事故22起。

表1 船舶碰撞指标

影响因素

变量名称

数据划分标准

碰撞时间

X1

白天0,黑夜1

会遇态势

X2

追越 1,对遇 2,交叉 3

驾驶人员

X3,X4

船长到三副和其他分级量化

瞭望情况

X5

将两船瞭望情况分级量化

船舶类型

X6,X7

按照结构,用途分类量化

船舶吨位

X8,X9

船舶真实吨位

船长

X10,X11

船舶真实船长

碰撞角度

X12

报告记录的角度

碰撞位置

X13

按船舶头、中、尾分类量化

相对速度

X14

船舶碰前速度的合成

天气

X15

按恶劣程度分类量化

能见度

X16

根据能见度分级表量化

风速

X17

报告记录的风速

流速

X18

报告记录的流速

事故严重等级

Y

依据《水上交通事故统计办法》对事故等级分类

3.2 分析预测模型

船舶碰撞事故分析预测模型由两部分构成:一是船舶受损严重程度的要素分析,即研究那些因素对船舶碰撞结果有较大的影响;二是船舶碰撞程度预测,即是通过船舶碰撞指标预测船舶碰撞严重程度。

图1是基于因子分析和GA-SVM的船舶碰撞事故分析预测模型结构图。首先将事故报告中提取的船舶碰撞量化数据进行z-score标准化预处理,运用因子分析得到船舶碰撞主因子。然后进行两方面的处理,一方面将主因子经过Logistic回归分析,进行船舶受损程度的致因要素分析;另一方面将主因子通过GA-SVM训练得到预测模型。

图1 船舶碰撞事故分析预测模型

上述模型弥补了现有模型的不足。通过因子分析减少了数据间的相关性,简化了输入变量;运用回归分析实现对影响因素的重要性程度排序,从众多因素中找出最主要的几个因素,避免单因素分析的弊端;遗传优化支持向量机遵循结构风险最小化原则,适用于非线性、高维数的二分类和多分类样本的预测分析。

实证分析

4.1 船舶碰撞事故因子分析

应用SPSS软件对船舶碰撞数据进行因子分析。输入变量后,首先检验数据的相关性,计算验证得KMO值为0.689,并且Bartlett球形检验小于0.001,表明各输入变量间具有一定的相关性,适合进行因子分析。用主成分法对数据进行因子分析,由表2的积累方差贡献率可以看出,若提取10个主因子总体方差解释率可以达到85.691%,包含了原始数据大部分信息。

用主成分法进行因子分析,提取10个主因子。为了更好地用语言来解释所得因子,需要进行因子旋转,采用基于最大方差法的因子旋转后的因子载荷矩阵如表3所示。由载荷矩阵可以看出,18个指标分别在10个主因子中的某一个具有较高的因子载荷量(大于0.6),即说明10个主因子能够明显地用几个指标的组合来予以说明解释。

表2 特征值和积累方差

<td

全文共10775字,剩余内容已隐藏,支付完成后下载完整资料</td


资料编号:[144996],资料为PDF文档或Word文档,PDF文档可免费转换为Word

因子

特征值

方差%

积累方差%

因子

特征值

方差%

积累方差%

1

3.909

21.718

21.718

10

0.587

3.26

85.691

2

3.2

17.778

39.496

11

0.545

3.027

88.717

3

1.484

8.246

47.742

12

0.466

2.591

91.309

4

1.445

8.03

55.772

13

0.458

2.542

93.851

5

1.172

6.511

62.283

14

0.366

2.034

95.885

6

1.042

5.791

68.075

15

0.279

1.549

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。