用于社区检测的深度学习:进步,挑战与机遇外文翻译资料

 2022-08-08 11:08

英语原文共 7 页,剩余内容已隐藏,支付完成后下载完整资料


该论文由IJCAI-2020发表,土井:10.24963/ijcai.2020/693

用于社区检测的深度学习:进步,挑战与机遇

刘凡珍1,山雪1,2,贾武1lowast;,川州3,胡文彬4

巴黎Cecile2,1,尼泊尔Surya2,1,Jian Yang1,Philip S.Yu5

1 麦格理大学计算机系,澳大利亚悉尼

2 CSIRO的Data61,澳大利亚悉尼

3 中国科学院数学与系统科学研究院,北京,中国

4 武汉大学计算机科学学院,武汉,中国

5 伊利诺伊大学芝加哥分校计算机科学系,美国芝加哥

{fanzhen.liu@hdr,jia.wu@,jian.yang@}mq.edu.au,zhouchuan@amss.ac.cn, hwb@whu.edu.cn

{艾玛.薛,苏里亚.尼帕尔,塞西尔.帕里斯}@data61.csiro.au,psyu@uic.edu

摘要

C1

C2

随着社区表达出相似的意见,相似的功能,相似的目的等,社区检测在科学查询和数据分析中都是一个永恒而又非常有用的工具。但是,随着深度学习技术的发展,处理具有高性能的高维图形数据的能力日益增强,诸如频谱聚类和统计推断之类的经典社区检测方法正在逐渐消失。因此,对通过深度学习进行社区发现的当前进展进行调查是及时的。在这个领域中,它分为三个广泛的研究流-深度神经网络,深度图嵌入和图神经网络,总结了各种研究的贡献。

每个流中的框架,模型和算法,以及尚未解决的当前挑战和未来的研究机会。

介绍

网络/图形的两个基本元素是节点和边。从连通性和密度的角度来看,社区称为局部密集的连通子图或节点簇[Fortunato和Hric,2016年]。除了子图的内部衔接之外,还应考虑子图之间的分隔。为此,图论提出了两个特定规则,用于确定社区的这些节点和边线中的哪一个:1)社区中的节点紧密相连; 2)不同社区中的节点稀疏连接。一个简单而普遍的理解是,社区是比内部连接拥有更多内部连接的子图。

在现实世界中,社区中的节点可以共享公共属性或提供类似的功能[福尔图纳托(Fortunato),2010年],找到这些共同点是实现

lowast;通讯作者

图1:社交网络中社区检测的示例。

该网络根据个人的亲密程度分为两个社区:社区C1包含三个节点,社区C2包含四个节点。

当今存在的每一种社区检测策略。社区检测,或更具体地说,基于相似功能或一组功能对节点进行聚类,有助于我们了解网络的固有模式和功能。例如,蛋白质-蛋白质相互作用(PPI)网络中的社区检测揭示了具有相似生物学功能的蛋白质[陈和元,2006]。在引文网络中,社区检测确定研究主题的重要性,相互联系和发展[陈和雷德纳,2010年]。在企业网络中,可以通过研究公司的离线内部资源和在线企业社交关系将员工分组为社区[张等人,2017]。在Twitter和Facebook等社交网络中,具有共同兴趣或共同朋友的用户可能是同一社区的成员[Yang等,2013],如图1.

大多数传统的社区检测方法都是基于统计推断和传统的机器学习。例如,一种最广泛使用的检测社区并描述社区形成方式的方法是

阿尔西夫:2005.08225v2 [cs.SI] 2020年9月23日

本文的发行版本可在以下网址获得:https://www.ijcai.org/Proceedings/2020/0693.pdf

随机块模型[卡勒和纽曼,2011年]。但是,尽管该策略过去很流行,但在当今复杂的数据集和复杂的社交场景下仍然难以解决。在传统的机器学习中,检测社区通常被认为是图上的聚类问题。但是这些方法高度依赖于数据的特征。例如,光谱聚类[Ng等,2002],使用特征向量将节点划分为社区,但在稀疏网络中效果不佳。

越来越清楚的是,网络规模的扩大和数据的维数需要更强大的技术,以可行的计算速度保持有效的性能[罗斯瓦尔和伯格斯特罗姆,

社区检测

在本文中,网络是一种特殊的图,它抽象了现实系统中的复杂关系,例如互联网,学术合作或社会团体。

义1(网络)根据图论,加权网络表示为G =(V,E,W),未加权网络表示为G =(V,E),其中V和E表示节点和边的集合W分别表示E的相应权重,以连接的强度或容量为单位。在未加权的网络中,W被视为1,可以将其从G中删除。

子图g G是保留原始网络结构的图的分区。子图的划分如下

sube;

2008].

至少到目前为止,深度学习

[LeCun等人,2015年] 是

预定义的规则,不同的规则可能会导致不同的结果

子图的形式。社区是一种子图,

解决方案。通过深度学习,计算模型可以学习多个抽象级别的数据表示形式,这非常适合于网络数据。此外,它学习非线性特征的能力得到了极大的提高,并且在数据具有内部关系的广泛领域中都取得了成功,例如计算机视觉和自然语言处理。此外,多层深度神经网络可以降低数据的维数[ 2018],从而扩大了网络分析任务(如社区检测,节点分类和链接预测)的潜在范围。

在本次调查中,我们重点研究了用于社区检测的深度学习的新趋势。我们的调查分为三个主要部分:

    1. 我们审查并评估了各种深度学习方法在社区检测中的优势;
    2. 我们从技术角度总结并归类了最新的研究。和
    3. 我们确定并讨论了尚待解决的技术挑战,以及对未来工作的潜在机遇的建议。

据我们所知,这是对深度学习进行全面回顾以进行社区检测的第一项工作。我们调查的大多数论文都在人工智能,机器学习,数据挖掘和Web服务等领域的国际影响力最近的国际会议上发表,例如NIPS,ICLR,AAAI,IJCAI,KDD,ICDM,CIKM,ICDE和万维网。 高质量的同行评审期刊中的文章也包括在内。

该调查中的信息应直接支持研究人员和技术专家,以了解用于社区检测的深度学习领域的过去,当前和将来的趋势。

本调查的其余部分安排如下。部分2 阐明了社区检测的概念。部分3 解释了为什么当今的社区检测方法必须基于深度学习的原因。本节概述了基于深度学习的新型社区检测方法4. 部分5 讨论了由于最近的进展而在该领域尚存的挑战,并为学者和领域专家提供了未来研究机会的建议。最后一节6 结束调查。

代表一种真正的社会现象。换句话说,社区是一组具有共同特征的人或对象。

义2(社区)社区是节点共享密集连接的网络中的子图。稀疏连接的节点描绘了社区。在这里,我们使用= C1,C2,...,Ck 表示一组k个社区

C { }

从网络G划分,其中Ci 是第i个社区

从此网络分区。群集到社区Ci 中的节点v满足社区内部每个节点的内部度超过其外部度的条件。

因此,社区检测的目标是发现网络G中的社区C。

为什么要通过深度学习进行检测?

与其他机器学习方法相比,用于社区检测的深度学习的明显优势在于它能够对高维数据的特征表示进行编码[张,2018]。使用图形结构的数据,可以转化为利用网络的拓扑信息[福图 北约,2010]。深度学习模型还可以学习节点,邻域和子图的模式[Wu等,2020]。另外,它们对与大规模图形数据相关的稀疏性具有更大的弹性。最后,在许多实际场景中,考虑到大多数节点都是未标记的,并且对数据中的社区几乎没有了解,因此深度学习是无监督学习任务的最佳选择[Tian等,2014].

除了简单地检查网络拓扑以检测社区之外,一些策略还探索语义描述作为数据中的节点特征。传统的社区检测方法主要基于邻接矩阵和节点属性矩阵[Yang等,2013;他等 ,2017]。但是,深度学习可以创建更强大的节点属性和社区结构表示。为此,最近的研究表明,在深度学习社区检测中,有希望的新方向

挑战一:

社区数量未知

挑战二:分层网络

机会?

美国有线电视新闻网-

基于

基于自动编码器

挑战三:

网络异质性

深度NMF-

基于

挑战四:

边缘签名信息

用于社区检测的深度学习

全球通讯网络-

基于

基于

挑战五:

社区嵌入

lt;

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[258394],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。