面向社交网络隐私保护的数据挖掘外文翻译资料

 2021-12-09 10:12

英语原文共 5 页

面向社交网络隐私保护的数据挖掘

Ms. Brinal Colaco

M.E. Student in Computer Engineering Dept. Faculty of

Computer Engineering

St. Francis Institute of Technology

Mumbai University

Mumbai-400103. India.

Mr. Shamsuddin Khan

Assistant Professor,

Department of Computer Engineering

St.Francis Institute of Technology,

Mumbai University

Mumbai- 400103, India

摘要 - 技术的进步使其成为可能黑客和入侵者收集个人和专业数据关于个人和他们之间的联系,例如他们在互联网上的电子邮件通信和友谊。这些黑客可能是第三方机构或有兴趣了解更多用户的个人社交网络。大多数信息都存在于这些中社交网络不是私有的,但学习算法可能是用于公共数据来预测私人信息。这个论文侧重于私人信息泄露问题来自社交网络上的信息。它代表社交网络中的因果关系数据采用模糊软计算技术推理系统。提出了适用于各种推理攻击场景的推理攻击技术,并对这些技术的有效性进行了分析

关键词 - 社交网络安全,推理攻击,模糊推理系统

一、导言

社会网络分析是对社会网络的分析。在社交网络中,网络中的个体实体被认为是节点,实体之间的关系被认为是节点之间的链接[1][2],兴趣爱好、音乐兴趣、电影、书籍、喜爱的活动、专业信息等细节。用户的信息存在于个人的用户配置文件[3]中。社交网络收集了大量的个人信息,因此应用提供商有机会利用现有的信息。然而,在实践中,对隐私的关切可以阻止这些努力[4][5]。希望使用数据与个人隐私之间的冲突为维护隐私的社会网络数据挖掘提供了机会,即在不侵犯个人隐私的情况下从社会网络数据中发现信息和关系[3]。本研究的重点是利用存在于社交网络上的用户的公共信息来预测私人信息。在社交网络中,用户拥有的个人资料使他们的个性的某些方面可以预测。识别或预测潜在的私人属性可能产生负面影响。例如,可以确定用户的性取向是通过从facebook上获取用户的性别、他们感兴趣的性别等几个细节来确定的。而好友名单上的朋友或对社交网络上的几个群体感兴趣的用户的相同细节,可以预测他/她与某个政治团体的联系[6][7]。从社交网络上的信息推断出私人信息是一个重大的安全漏洞。为此,探讨了一类特定的攻击,即推理攻击。这些攻击用于获取有关主题或数据库的知识。这些攻击试图从现有的琐碎信息中对敏感信息进行分级。本文的主要目的是提出一种基于模糊推理系统的预测个体隐私信息的专家系统的开发方法,并提出避免推理攻击的方法。以前还没有做过针对社交网络推理攻击的技术实现的研究。该技术的效率将与其他社交网络推理攻击技术的效率相比较(例如Naiuml;veBayesian分类技术)。

二、相关工作

工作社交网络中的隐私领域非常广阔,涵盖了许多研究领域。C.等人[8]考虑了社会网络的几种方式,但本文的研究涉及的是社会网络的细节,而不是个体识别,转制,试图对社会网络的私密信息进行识别。在[8]中,他等人考虑了如何通过友谊链接通过建立一个贝叶斯网络,通过社交网络内部的链接来获取私人信息。许多推断攻击可以使用第三方扩展来执行。在[3]中,利用社交网络数据进行推理攻击,预测私密信息。本文还讨论了一种防止社交网络数据推理的社会化网络。它审查了这些方法在真实世界数据集上的有效性。作者使用Na ve分类和其他混合分类技术进行推理。在[10]中,等人研究了可以通过Facebook的扩展应用编程接口(API)发起的推理攻击。设计了此类攻击,并提出了风险度量,以帮助第三方应用程序的用户改进其隐私期望。在[11]中,雷等人写了基于社交网络攻击的共同朋友特征。“共同朋友”功能引起了对隐私的重大关注,因为用户可以使用它查找一些或全部

受害者的朋友,尽管,根据受害人,不被授权直接看他的朋友名单。它只关注共同朋友的特征,因为本文考虑了包括共同朋友在内的任何信息。上述工作均未采用模糊推理系统技术。本文主要研究利用模糊推理系统对现有公共信息进行私有信息预测的方法。决策支持的选择是由于应用的性质,以及私有信息的预测是一个复杂的过程,具有充分的交互参数,模糊推理适合于这类问题。由于易于使用和计算时间要求较低,也成为一个很好的选择[12][13]

三、建议的工作

本文提出的工作重点是确定社会网络上的公共数据是否足够脆弱,可以预测敏感的私人信息,从而提出避免这种情况的方法。该系统的实现包括以下核心模块:从社交网络收集数据:建立一个Facebook个人资料数据库,对所提议的系统进行测试。该数据库由用户姓名、性别、状态、Facebook上喜欢的组、用户的音乐兴趣、Facebook上喜欢的页面、Facebook上的好友数量、用户感兴趣的性别等基本用户信息组成。作出了三个私人属性的预测,即宗教、政治派别和性取向。宗教是利用可用的公共信息(如用户的音乐兴趣和用户的状态)来预测的。政治归属是通过宗教和Facebook上喜欢的相关政治团体来预测的。性倾向的预测使用相关的群体,网页喜欢和脸谱网上的/类似的朋友的数量。

图3.1 拟议系统

制定模糊的if-then规则:模糊输入给模糊推理系统与AS模糊推理使用时,得到的输出也是模糊的。为了获得输出,制定了模糊中频规则.将根据这些规则获得正确的输出。例如,

如上表所示,宗教是可以使用可用/公共属性(如用户的状态和音乐兴趣)预测的私有属性。所以,对于一个属于国家,对印度古典音乐有兴趣的人,或者属于印度教的人,对于那些以印度教为宗教,以辛教徒为最爱的群体的人来说,他们最喜欢的群体将是一个很强的政党。所有的预测规则都是在一般情况下制定的。对所有的用户来说,这可能不是真的。此外,属性的一致性来自分配给它的重叠成员函数。例如,考虑到边境地区和边境地区,大多数居住在边境的人都会受到两种文化的影响。宗教在这种情况下,将被预测为Maharastrian-天主教徒。

使用模糊推理系统检查私有信息推理:在为所有属性可用,系统根据数据的可用性对私有属性进行分级。由于这些属性是相互联系的,因此无法预测政治派别-用户的宗教信仰不是作为一种投入而存在的。在许多情况下,最有限和最私人的属性是性取向。但是性倾向可以用“对男人或女人感兴趣”这样的单一属性来预测。

建议的清除方法:表示接受避免或防止推理攻击的适当措施。这些建议对于不同的用户来说可能是不同的,因为它们是基于私有信息的,或者是预测的。这些建议中的大多数都很简单,只需做一个小小的更改,比如从社交网络的用户配置文件中删除一些信息,或者将用户配置文件的某些属性私有化。

检验模糊推理系统对Nave Bayes分类的有效性:私有属性的推理利用基于概率的贝叶斯分类技术,得到了基于概率的贝叶斯分类方法。在模糊推理系统中,与Nave贝叶斯系统相比,具有更好的精度。计算了三个参数-精确性、召回性。

四、实验结果

本文主要研究对社交网络的推理攻击。这些推理攻击是利用模糊推理系统和朴素贝叶斯分类进行的。如果私有属性正确,系统将根据预测提供建议,以避免推理攻击。对模糊推理系统和朴素贝叶斯分类技术的性能进行了测试,以确定分类的准确性、准确性和召回率[15]。在表中显示了不同用户范围的结果,并以2000名用户的轮廓信息作为数据集进行了实验。社会网络数据集的一般细节见表1。

实现了两种算法来预测私有来自可用公共信息的信息。该在Mamdani FIS [16]上实施的数据集很高预测准确性。 个人的性取向是还根据群体喜欢和数量预测朋友列表中的无性/双性恋/同性恋朋友个人。 使用Naiuml;ve完成了类似的预测贝叶斯分类。 精度精度等参数并回顾两种技术的比较基础这些预测。这两种方法都使用了2000个条目的数据集 - Mamdani和朴素贝叶斯。 结果计算如下确定准确性,精确度和召回率。

图4.1预测模糊推理系统

图4.2-在转轨之后使用预测

图4.3预测的Na ve Bayes分类

图4.1显示了使用模糊推理系统对私有属性的预测以及建议。根据输入属性,可以预测私有属性,并根据预测对建议进行更改。图4.2显示了后面的结果。图4.3显示了使用Na ve Bayes分类技术进行的预测。

如表3.3所示,这两种技术的准确性是政治倾向和性取向预测的精确性和召回性变化。

表3.3:10个条目的结果

表3.4 1000个条目的结果

表3.5 10个条目的结果(5个政治团体被删除/转为私人团体)

表3.6:1000个条目的结果(移除500个州)

在表3.4中,性倾向预测的准确性、准确性和召回率很低,因为在数据库中,由于敏感程度高,预测性取向的数据仅限于100个用户。下表显示了某些属性为私有后的结果,即清除。

表3.5和表3.6包括清除后的结果。结果表明,这两种技术的精度和精度大大降低。与Nave贝叶斯分类相比,模糊推理系统具有更好的分类效果。

五、结论

本文重点研究了社会网络中与私密信息泄露相关的各种问题。推理攻击是导致社交网络数据滥用的最关键攻击之一。研究结果表明,评估是一种有效的预测方法,能够更准确地预测私人信息泄漏。将该方法与同一数据集上的Nave Bayes技术进行了比较。结果表明,模糊推理系统具有较好的精度和精度。该系统决定了用户配置文件是否易受推理的影响,该系统隐藏了导致私有属性预测的信息。该系统降低了对私密信息的准确性。该系统将尽量减少对社交网络的推理攻击,从而提高用户的体验。还可以做进一步的工作来解决冷启动问题。用户的配置文件可能容易受到以下攻击的问题

即使没有足够的信息也会受到攻击。

参考文献

[1] Pinheiro, Carlos A.R. (2011). Social Network Analysis in Telecommunications. John Wiley amp;Sons. p. 4. ISBN 978-1-118-01094-5.

[2] D#39;Andrea, Alessia et al. (2009). 'An Overview of Methods for Virtual Social Network Analysis'. In Abraham, Ajith et al.Computational Social Network Analysis: Trends, Tools and Research Advances. Springer. p. 8. ISBN 978-1-84882-228-3.

[3] Raymond Heatherly, Murat Kantarcioglu, and BhavaniThuraisingham, “Preventing Private Information Inference Attacks on Social Networks”, Knowledge and Data Engineering, IEEE Transactions on Volume: 25, Issue: 8 Publication Year: 2013 ,Page(s): 1849 – 1862

[4] PoojaShelke, AshishBadiye, “Social Networking: Its Uses and Abuses”, Research Journal of Forensic Sciences, Nagpur, Maharashtra, (2013): 2-7.

[5] Facebook Beacon, 2007.

[6] C. Johnson, “Project Gaydar,” The Boston Globe, Sept. 2009.

[7] K.M. Heussner, “bdquo;Gaydar‟ n Facebook: Can Your Friends Reveal Sexual Orientation?” ABCNews,http://abcnews.go.com/Technology/gaydar-facebook-friends/story?id=8633224#.UZ939UqheOs, Sept. 2009.

[8] M. Hay, G. Miklau, D. Jensen, P. Weis, and S. Srivastava, “Anonymizing Social Networks,” Technical Report 07-19, Univ. of Massachusetts Amherst, 2007.

[9] He, Jianming, Wesley W. Chu, and Zhenyu Victor Liu. 'Inferring privacy information from social networks.' Intelligence and Security Informatics. Springer Berlin Heidelberg, 2006. 154-165.

[10] Ahmadinejad, Se

资料编号:[5958]

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。