搜索详情-外文翻译网

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回

一种蛋白质结构的免疫算法对晶格模型的预测外文翻译资料

 2022-07-18 07:07  

一种蛋白质结构的免疫算法对晶格模型的预测

Vincenzo Cutello, Giuseppe Nicosia, Member, IEEE, Mario Pavone, and Jonathan Timmis, Member, IEEE

摘要:我们提出了一种免疫算法(IA),这种算法受克隆选择原理的启发,该原理是为蛋白质结构预测问题(PSP)设计的。 所提出的IA使用两种特殊的变异算子,超变异和超变异性来实现有效搜索,以及一种老化机制,它是一种新的免疫启发算子,设计用于在进化过程中增强种群的多样性。

涉及优化问题时,PSP可以被视为以最小的能量发现蛋白质构象。所提出的IA在知名的PSP晶格模型,二维和三维方格中的HP模型以及功能模型蛋白质上进行了测试,这是一个更现实的生物模型。

我们的实验结果表明,所提出的IA与关于晶格模型上的PSP的现有算法非常具有竞争性。

关键词:老化算子,克隆选择算法,功能模型蛋白,超高分辨率算子,超分子算子,免疫算法(IAs),蛋白质结构预测问题,二维HP模型,三维HP模型。

Ⅰ.概述

人工免疫系统(AISs)代表了一个生物启发式计算领域,它试图利用现代免疫学的理论,原理和概念来设计基于免疫系统的科学和工程应用[1] - [3]。 免疫系统(IS)的一个作用是保护宿主有机体免受抗原(即病毒和细菌)的攻击,并消除已被“感染”的细胞。它提供了一个自下而上的智能 策略[4],通过这种策略适应局部细胞和分子水平,有用的行为在全球范围内出现:这可以通过免疫的体液和细胞反应来体现。

AIS被证明是生物启发计算的一种非常普遍和适用的形式。 大量的工作已经发展到推广基本免疫过程的算法,如克隆选择,阴性和阳性选择,危险理论和免疫网络[2]。 迄今为止,AIS已经应用于机器学习[5],[6],优化[7] - [9],生物信息学[9] - [11],机器人系统[12] - [14],决策 支持系统[15],网络入侵检测[16],[17],组合优化[18],[19],调度[20],异常检测[21],故障诊断[22],[23] [24],数据分析[10],[25],[26],病毒检测[27]以及许多其他领域[1] - [3],[28]。 AIS领域似乎不仅是一个强大的计算范例,而且可能是提高对生物数据和系统理解的突出设备[9],[29]。

当设计任何计算解决方案时,应始终考虑问题空间的性质。在AIS这样的新兴领域尤其如此,我们必须避免[30]的作者警告我们反对的一刀切的态度。考虑到这一点,在[2]中介绍的AIS框架的背景下,我们引入了基于克隆选择原则的免疫算法(IA)[9]。我们在HP模型中为二维(2-D)和三维(3-D)晶格以及功能模型中的蛋白质采用了新的老化算子和针对蛋白质结构预测问题(PSP)量身定制的特定变异算子。鉴于蛋白质的主要序列,蛋白质结构预测问题需要以最小能量鉴定其天然(第三)构象;而蛋白质折叠问题需要关于可能的折叠和展开途径的信息。由于蛋白质的结构决定其生物学功能,因此能够预测蛋白质的最终空间构象是非常重要的。本文只涉及静态方面,即如何预测蛋白质的折叠三级结构,通过使用晶格模型给出其氨基酸序列。

本文结构如下:第二节描述Dill模型和功能模型蛋白质中的蛋白质结构预测问题;第三节介绍受克隆选择理论启发的IA,用于蛋白质结构预测问题;第四部分详细介绍执行机构使用老化过程的特征动态;第五节描述用于划分PSP景观的技术,以及老化过程和记忆B细胞的应用,以改善算法的整体性能;第六节报告二维惠普模型的结果;第VI-A节介绍以前的相关工作,并将这些与建议的IA之间的二维HP模型进行比较;第七节介绍三维HP模型的结果;第八节介绍功能模型蛋白的结果;第九节提供IA和其他生物刺激算法之间的简单比较;第十节是结束语。

手稿于2005年8月9日收到; 2006年1月3日修订。

  1. Cutello,G. Nicosia和M. Pavone分别在卡塔尼亚大学数学和计算机科学系工作,95125卡塔尼亚,意大利(电子邮件:vctl@dmi.unict.it; nicosia@dmi.unict.it; mpavone@dmi.unict.it)。
  2. Timmis工作于约克大学计算机科学系和电子系,黑斯林顿,约克 YO10 5DD,U.K.(电子邮件:jt517@ohm.york.ac.uk)。

Digital Object Identifier 10.1109/TEVC.2006.880328

Ⅱ.PSP的格式模型

基本上有5种方法来模拟PSP:分子动力学[31],蒙特卡罗方法[32],统计力学模型[33],[34],基于概率路线图[35],[36]和晶格模型[37],[38]。前两种技术已被用于分析折叠路径的数量和特征;后两种技术是研究折叠景观的有用工具,而最终技术虽然具有基本的理论相关性,但不能直接应用于真正的蛋白质。在本文中,我们专注于晶格模型,特别是我们使用众所周知的Dill晶格模型,HP模型[39]和“移位”HP模型(也称为功能模型蛋白质)[40]。

HP模型将疏水相互作用作为蛋白质折叠的主要驱动力。惠普模型只涉及吸引互动。与Dill的模型不同的是,功能模型蛋白质具有独特的原生折叠,原生和第一激发态之间存在能量差距;天然状态并不是最紧凑的,因此呈现空腔或潜在的结合位点,这是研究配体结合所需的关键生物学特性。为了包含这些属性,功能模型既具有吸引力又具有排斥性。

  1. Dill模型

蛋白质是氨基酸序列。在标准的Dill模型中,每个氨基酸都表示为珠子,连接键表示为线条。在这种方法中,蛋白质由仅有两种类型珠子H(小珠疏水/非极性)或P(小珠亲水/极性)的特定序列组成;即20个氨基酸可以分为两类:H和P.这通常被称为HP模型(或Dill模型)[39],其中标签P用于表示亲水氨基酸,因为这些氨基酸是也是极地的。我们将字母从20个字符缩减为2个,其中我们的蛋白质序列采用属于字母表的字符串形式。疏水性氨基酸趋于一起形成排除水的紧密核心。由于细胞内部的环境是水性的(主要是水),这些疏水性氨基酸倾向于位于蛋白质的内部,而不是位于其表面。疏水性是决定氨基酸链如何折叠成活性蛋白质的关键因素之一。

整个构象被嵌入二维或三维晶格中,它简单地将空间分成氨基酸大小的单元。键角仅具有有限的离散值,由晶格结构决定(例如,正方形,三角形或立方[41],[42])。格点可以是空的或包含一个珠子。特别是,在二维正方形晶格上,HP模型将蛋白质表示为晶格上2-D自避免珠链的步行链,即两个珠子不能占据晶格的相同位置,并且每个珠子占据只有一个格子网站连接到它的链式邻居。

  1. 蛋白质能量:对于每种构象,可以评估能量函数的值:这允许建立蛋白质折叠的自由能。 最简单的能量函数形式可以计算H-H-接触的数量。 每个H-H地形触点都有能量值,而所有其他触点相互作用类型(H-P,P-H,P-P)都有能量值。 如果两个氨基酸是拓扑邻居,并且它们不通过键连接,则两个氨基酸产生H-H-接触。 目标是找到能源最低的协议。 在一般的HP模型中,残基的相互作用可以定义如下:和当和时,我们有标准HP模型的典型相互作用能矩阵[39]; 而对于和,我们有移动HP模型的交互能量矩阵[43]。 对于迪尔的模型,原生构象是最大化接触H-H数量的那种,即使自由能函数最小化的那种。

关于功能模型蛋白(在第八节中描述),为了找到结合口袋和所需的能隙,天然构象在HH接触的数量(即吸引力)和非HH接触(即,排斥力)。

表1显示了收敛过程中IA的快照,应用于不同能级的蛋白质序列1(见表I):从差的构象到具有能量9的天然构象(HH接触由虚线表示线和黑色圆圈的疏水残基)。

表1.二维方格标准HP基准[41]和[44]

  1. 二维方格标准HP基准:对于我们的实验,我们使用了Tortilla 2-D HP Benchmarks1的前九个实例(前八个序列取自[44],序列9取自[45],最后三个实例来自[41])来测试设计的IA的搜索能力。在表1中,是最优或最知名的能量值,表示相对符号或子序列的重复。

12个选定的HP实例是用于测试启发式方法和盲搜索算法的搜索能力的标准基准。 这些实例已经通过20多种不同的算法进行了测试(参见第VI-A节和表VII)。 对HP模型进行分析对于计算机科学家来说非常有趣且具有挑战性,但对于许多生物学家来说这被认为是不令人满意的。 虽然蛋白质在二十多年内自然折叠,但计算生物学家发现将蛋白质折叠成最小能量构象是一个未解决的优化问题。 在HP模型上的PSP已被证明是NP完全的二维[46](NP-硬度由平面Hamilton循环问题的一个有趣的变化减少)和三维晶格[47 ](NP-硬度通过从装箱问题的变化中减少来显示)。

B.功能模型蛋白质

1)在HP模型中,两个疏水残基之间的相互作用为零,而其他可能的对(HP,PH和PP)为零,即HP模型包含一个吸引相互作用(H与H)和三个中性相互作用 (H与P,P与P),因此可以写出HP模型的能量矩阵

  1. 还有许多其他折叠码,即不同类型的残基的数量和描述不同种类残基之间相互作用的能量矩阵。 一个重要的折叠代码是“移位的”HP模型(或功能模型蛋白)[40]。 该模型具有不是最大程度紧凑的原生折叠,并且呈现空腔或潜在结合位点,这是调查配体结合所需的关键生物学特性。 为了包括这些性质,移位的HP模型具有两种珠粒类型,并且具有吸引力和排斥性相互作用。 因此,移位的HP能量矩阵是

在转移的HP模型中存在结合位点使得我们可以简要地讨论模型的生物相关性。 这些位点支持大量蛋白质,这些蛋白质可以分类为功能性蛋白质,基态与正常HP模型相比,具有更低的退化和更多的合作折叠[48]。

  1. 晶格中的构象空间

为了将疏水性图案嵌入到晶格中,我们有以下三种方法[49]。

1)笛卡尔坐标:残差的位置是独立于其他残基指定的。

2)内部坐标:每个残基的位置取决于序列中其前一个残基。有两种类型的内部 坐标:剩余方向相对于格子定义的轴的绝对方向,以及剩余方向相对于上一次移动方向的相对方向。

3)距离矩阵:给定残差的位置是通过距离矩阵来计算的。

Krasnogor等人 [49]使用具有相对和绝对方向的演化算法(EAs)进行了详尽的比较研究。实验结果表明,相对方向几乎总是优于方形和立方晶格上的绝对方向,而绝对方向在面对三角晶格时具有更好的性能。实验证据表明应使用具有相对方向的内部坐标。但是,总的来说,很难评估EA的表现方向编码的有效性。

Ⅲ. 免疫算法

A.克隆选择原则

克隆选择理论[50]表明,能够识别抗原的B和T淋巴细胞在识别这种抗原后通过克隆开始增殖。当通过结合抗原活化B细胞(并且从T淋巴细胞接收第二信号)时,通过称为克隆扩增的过程产生许多克隆作为响应。产生的细胞可以进行体细胞超突变,产生具有突变受体的后代B细胞。 B细胞对可用抗原的亲和力越高,其克隆越有可能。这导致达尔文的变异和选择过程,称为亲和力成熟。这些人群规模的增加伴随着生命期长于预期的细胞的产生,确保该生物体对未来的抗原攻击具有更高的特异性反应性。这引起免疫记忆,这通过以下事实来证明:当宿主首次暴露于抗原时,启动主要反应;在这个阶段,抗原被识别并且发展了免疫记忆。当将来遇到相同的抗原时,就开始二次免疫应答。这是由于刺激已经专门化并作为记忆细胞存在的细胞:观察到抗体的快速且更丰富的产生。次要反应可以从任何类似的抗原中得到,尽管它们与建立记忆的原始抗原不相同。这就是所谓的交叉反应。

B.克隆选择算法

建议的IA(见表II)采用两种实体类型:抗原(Ag)和B细胞。 Ag模拟给定蛋白质的疏水模式,即序列,其中蛋白质长度,即蛋白质序列中的氨基酸数目。 B细胞群体代表了当代健身领域的一组候选解决方案。 B细胞或B细胞受体是一系列的方向,其中每个与是相对于前一个方向的相对方向[49]而代表非相关方向。 因此,我们获得一个的整体的长度序列。 该序列指定适合于计算给定蛋白质的疏水性模式的能量值的2-D构象。

在每一代t,都有一个大小为d的B细胞群。最初的人口,是以这样一种方式随机生成的,即每个初始B细胞是一种自我避免的配方。算法中有两个主要功能。

计算每个B细胞的适应度函数值;因此是B细胞受体编码的构象能量;并且Termination_Condi tion()找到解决方案后,则返回true,或达到最大数量的适应度函数评估。

实施的IA与所有基于上述克隆选择原则的IA一样,其特征在于克隆具有较高抗原亲和力,亲和力成熟和后代B细胞的高度突变的B细胞。在我们的方法中,我们使用三种免疫算子:克隆,超变和衰老,以及标准进化算子:选择算子。

  1. 静态克隆算子:克隆算子[4],[18]简单地克隆每个B细胞时间产生一个大小的中间群体。在本篇论文中,我们将把它称为静态克隆算子,而不是比例克隆算子(用于CLONALG [8]的模式识别版本),它将B细胞按比例克隆到它们的抗原亲和力。使用这种算子(本文未显示)的PSP的实验结果表明种群进化期间频繁的早熟收敛。

    全文共32296字,剩余内容已隐藏,支付完成后下载完整资料


    英语原文共 17 页,剩余内容已隐藏,支付完成后下载完整资料


    资料编号:[9192],资料为PDF文档或Word文档,PDF文档可免费转换为Word

您需要先支付 30元 才能查看全部内容!立即支付

课题毕业论文、开题报告、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。