通过生物信息学分析鉴定卵巢癌预后不良的重要基因外文翻译资料

 2022-08-12 03:08

英语原文共 9 页,剩余内容已隐藏,支付完成后下载完整资料


通过生物信息学分析鉴定卵巢癌预后不良的重要基因

摘要

卵巢癌(OC)是最常见的恶性妇科肿瘤,其发病机制非常复杂。目前学术工作的目的是确定结果 不佳的重要基因及其潜在机制。GSE36668,GSE14407和GSE18520的基因表达谱可从GEO数据库获得。 在三个配置文件数据集中有69个OC组织和26个正常组织。通过GEO2R工具和Venn图软件挑选OC组织和正常 卵巢(OV)组织之间的差异表达基因(DEG)。接下来,我们利用数据注释,可视化和综合探索(DAVID)等工具来分析京都基因和基因组百科全书(KEGG)途径和基因本体论(GO)。然后用 Cytoscape和搜索工具显示这些DEG的蛋白质 - 蛋白质相互作用(PPI),以检索相互作用基因 (STRING)。在三个数据集中总共有216个一致表达的基因,包括富集细胞分裂, 姐妹染色单体凝聚,有丝分裂核分裂,细胞周期调节,蛋白质定位到动粒,细胞增殖和细胞周期, 黄体酮 - 介导卵母细胞成熟和p53信号通路的110个上调基因,富集腭发育,凝血,RNA聚合酶II启 动子转录的正调节,轴突发生,受体内化,RNA聚合酶II启动子的转录负调控和无明显信号途径的106个下调基因。 在通过分子复合物检测(MCODE)插件分析的PPI网络中, 33个上调基因被选中。此外,为了分析这些基因的总体存活率,实施了Kaplan-Meier分析,33个基因中的20个具有明显更差的预后。在基因表达谱分析交互分析(GEPIA)中进行验证,与正常OV组织相比,发现在OC组织中20种基因中有15种高度表达。此外,通过重新分析DAVID,发现四种基因(BUB1B,BUB1,TTK和 CCNB1)在细胞周期途径中显著富集。总之,我们在综合生物信息学方法的基础上,确定了OC中4 个显著上调的DEG存在预后不良,这可能是OC患者的潜在治疗靶点。

关键词:生物信息学分析,微阵列,卵巢癌,差异表达基因

背景

卵巢癌(OC)是全世界女性癌症死亡的第五大原因[1]. 尽管已经开发了一些预后生物标志物,但由于其早期检测,远端转移和快速传播的困难,OC的总体存活率仍然很低。因此,探索更可靠的预后生物标志物应作为改善治疗效果和更好地理解潜在机制的目标。已被使用达十年以上的基因芯片可以快速检测差异表达的基因,并被证明是一种可靠的技术[4]这产生了许多切片数据并存储在公共数据库中。因此,在这些数据的基础上进行新的研究可以探索大量有价值的线索。此外,近年来已经开展了许多关于OC的生物信息学研究 [5],这证明了综合生物信息学方法可以帮助我们进一步研究和探索潜在的机制。

在本研究中,首先,我们从 Gene Expression Omnibus ( GEO ) 中 选 择 GSE36668 , GSE18520 和 GSE14407。其次,我们申请了GEO2R在线工具和维恩图 软件,以获得上述三个数据集中常见的差异表达基因 (DEG)。第三,能够注释、可视化和综合发现的数据库

DAVID)用于分析这些DEG,包括分子功能(MF), 细胞成分(CC),生物过程(BP)和京都基因和基因 组百科全书(KEGG)途径。第四,我们建立了蛋白质—蛋白质相互作用(PPI)网络,然后应用细胞型 MCODE(分子复合物检测)进行额外的DEG分析,以鉴定一些核心基因。此外,这些核心DEG被导入Kaplan Meier绘图仪在线数据库,以获得重要的预后信息(Plt;0.05)。此外,我们通过基因表达谱分析交互分析(GEPIA)进一步验证了OV癌组织与正常OV组织之间的DEGs表达(P lt;0.05)。如上所述,只有15个DEGs合格。然后,我们重新分析了这些15个DEGs的KEGG途径富集。最后,发现4个DEGs(BUB1B,BUB1,TTK和CCNB1)并且在细胞周期途径中显着富集,特别是在G2 / M期。总之,我们研究的生物信息学研究提供了一些额外的有用的生物标志物,它们可能是OC患者的有效靶标。

方法

微阵列数据信息

NCBI-GEO被认为是微阵列/基因谱的免费公共数据库,我们在卵巢癌和正常卵巢组织中获得了GSE36668,GSE18520 和 GSE 14407的基因表达谱.GSE36668,GSE18520和GSE14407的微阵列数据均基于GPL570平台( [HG-U133_Plus_2] Affymetrix 人 类 基 因 组 U133 Plus 2.0阵列),其包括4个OC组织和4个正常OV组织, 53个OC组织和10个正常OV组织和12个OC组织和12个正 常OV组织。

DEG的数据处理

通过GEO2R在线工具识别|logFC|gt; 2并且修饰P值lt;0的OC样本和正常OV样本之间的 DEG [6]。然后,在在线Venn软件导入 TXT格式的原始数据,以检测三个数据集中的常见DEG。 log FC lt;0的DEG被认为是下调基因,logFCgt;0的 DEG被认为是上调基因。

基因本体论和途径富集分析

基因本体分析(GO)是一种常用的方法,用于定义基因及其RNA或蛋白质产物,以确定高通量转录组或基因组数据的独特生物学特性[7].KEGG是一个处理基因组,疾病,生物途径,药物和化学材料的数据库集合 [8]。DAVID是一种在线生物信息学工具,旨在识别大量基因或蛋白质的功能[9].我们可以使用DAVID来显示BP, MF,CC和途径的DEGs富集(P lt;0.05)。PPI网络和模块分析

PPI信息可以通过在线工具STRING(用于检索相互作用基因的搜索工具)进行评估[10]。然后,Cytoscape中 的STRING应用程序[11]用于检验这些DEG之间的潜在相关性(最大相互作用数= 0和置信度得分ge;0.4)。此外,Cytoscape中的MCODE应用程序用于检查PPI网络的模块(度数截止= 2,最大深度= 100,k-core = 2,节点得分截止= 0.2)。

核心基因的存活分析和RNA测序表达

Kaplan Meier绘图仪是一种常用的网站工具,用于评估基于EGA,TCGA数据库和GEO(仅限Affymetrix微阵列)的大量基因对生存的影响[12].计算具有95%置信区间的对数秩P值和风险比(HR)并在图上显示。 为验证这些DEGs,我们应用GEPIA网站,根据GTEx项目和TCGA的数千个样本分析RNA测序表达数据[13]。

结果

卵巢癌中的DEGs的鉴定

在我们目前的研究中有69个OC组织和26个正常OV组织。通过GEO2R在线工具,我们从GSE36668,GSE18520和GSE 14407中提取了1516,1150和1670个DEGs。然后,我们使用维恩图软件来识别三个数据集中的常见DEG。结果显示共检测到216个常见DEG,其中包括106个下调基因(logFC lt;0)和110个上调基因(logFCgt; 0)在OC组织中(表1 & 图。1).

DEGs基因本体和卵巢癌KEGG通路分析

所有216个DEGs用DAVID软件分析,GO分析结果表明1)对于生物过程(BP),上调的DEG特别富集在细胞周期调控,细胞分裂,有丝分裂核分裂,蛋白定位到动粒,姐妹染色单体凝聚和细胞增殖,凝血中的DEGs下调,RNA聚合酶II启动子转录的正调节,腭发育,RNA聚合酶II启动子的转录负调控,轴突发生和受体内化;2)对于分子功能(MF),上调的DEGs富含蛋白质结合,ATP依赖性微管运动活性,蛋白激酶结合,正末端定向,微管结合,序列特异性DNA结合和RNA聚合酶中下调的DEGs II核心启动子近端区序列特异性结合,RNA聚合酶II转录因子结合,RNA聚合酶II核心启动子近端区序列特异性结合和生长因子活性,转录抑制因子活性,转录激活因子活性;3)对于GO细胞成分(CC),上调的DEGs在细胞质,中体,纺锤体微管,纺锤体,细胞质和细胞核中显着富集,下调DEGs在膜,细胞外区域和细胞外的蛋白质细胞外基质锚定组分空间富集(表2).

KEGG分析结果如表所示3 结果表明,上调的DEG特别 富集p53信号通路,细胞周期和孕激素介导的卵母细胞 成熟,而在没有显着信号通路的情况下下调DEGs(Plt;0.05).

蛋白质 - 蛋白质相互作用网络(PPI)和模块分析

总共107个DEGs进入DEGs PPI网络复合体,其中包括107个节点和698个边缘,包括60个下调基因和47个上调基因 (图2a).在DEGs PPI网络中没有包含216个中的109 个(图2a).然后我们应用Cytotype MCODE进行进 一步分析,结果显示33个中心节点 在107个节点中发现了所有上调的基因(图2b).

通过Kaplan Meier绘图仪和GEPIA分析核心基因

Kaplan Meier绘图仪用于鉴定33个核心基因的存活数据。发现20个基因的存活率显着降低,而13例无显着性差异(P lt;0.05,表4 & 图。3).然后,GEPIA用于挖掘癌症和正常人之间的20基因表达水平。结果报道,与正常OV样本相比,20个基因中有15个在OC样本中反映出高表达(P lt;0.05,表5 & 图4).

通过KEGG途径富集重新分析15个选定的基因

为了理解这15种选择的DEG的可能途径,通过DAVID重新分析KEGG途径富集(P lt;0.05)。结果显示,4个基因(BUB1B,BUB1,TTK和CCNB1)在细胞周期途径中显着富集(P = 1.1E-4,表6 & 图。5).

讨论

为了鉴定OV癌症中更有用的预后生物标志物,该研究 在三个谱图数据集(GSE36668,GSE18520和GSE 14407) 的基础上使用生物信息学方法。在本研究中招募了六十九个卵巢癌标本和26个正常标本。通过GEO2R和Venn软件,我们发现总共216个常见变化的DEG(| logFC |gt;2并调整P值lt;0.05),包括110个上调(Log FCgt; 0)和106个下调DEG(Log FC lt;0) )。然后,使用DAVID方法的基因本体论和途径富集分析表明1)对于生物过程(BP),上调的DEG特别富集细胞周期,细胞分裂,有丝分裂核分裂,蛋白定位到动粒,姐妹染色单体凝聚的调节。细胞增殖,凝血中DEGs下调,RNA聚合酶II启动子转录正调节,腭发育,RNA聚合酶II启动子转录负调控,轴突发生和受体内化;2)对于分子功能(MF),上调的DEGs富含ATP依赖性微管运动活性,蛋白质结合,正末端定向,微管结合,序列特异性DNA结合,蛋白激酶结合和下调的DEGs转录抑制活性,RNA聚合酶II核心启动子近端区域序列特异性结合和生长因子活性,RNA聚合酶II核心启动子近端区域序列特异性结合,RNA聚合酶II转录因子结合,转录激活因子活性;3)对于GO细胞成分(CC),上调的DEGs在细胞质,中体,纺锤体微管,纺锤体,细胞质和细胞核中显着富集,并且在膜,细胞外空间和细胞外的蛋白质细胞外基质锚定组分中下调DEGs。区域。对于途径分析,上调的DEG特别富集p53信号通路,细胞周期和孕酮介导的卵母细胞成熟,而在没有值得注意的信号通路中下调DEGs(P lt;0.05)。接下来,通过STRING在线数据库和Cytoscape软件构建了108个节点和698个边缘的DEGs PPI网络复合体。然后,通过细胞型MCODE分析从PPI网络复合物中筛选出33个重要的上调基因。此外,通过Kaplan Meier绘图仪分析,我们发现33个基因中的20个具有显着更差的存活率。在GEPIA验证这20个基因时,15个基因反映了OC中的高表达样品与正常样品比较. (P lt;0.05)。最后,我们通过DAVID对KEGG途径富集的15个基因进行了重新分析,发现富含细胞周期的4个基因(BUB1B,BUB1,TTK和CCNB1)具有显着性(P lt;0.05),可以作为改善OC患者的预后新的有效目标。

有丝分裂检查点丝氨酸/苏氨酸激酶B(BUB1B),被 视为酵母Mad3的哺乳动物同源物,但它们有显着差异, 因 为 BUB1B 具有在 Mad3 中未发现的激酶结构域 [14].2004年,Kops GJ等人。报道由于BUB1B激酶活性 的抑制和人癌细胞中BUB1B水平的降低,可能发生凋亡 细胞死亡和大量染色体丢失[15].BUB1B已被证明可增 强肿瘤增殖,并且与几种类型的癌症(包括前列腺癌, 乳腺癌,胃癌和结肠直肠癌)的生存率相关[16–19]. 另一项研究证明,BUB1B的敲低导致体内肿瘤生长的抑 制,包括通过有丝分裂后核内复制检查点使已建立的 肿瘤消退[20]这是细胞周期中基因组的复制没有随后完成有丝分裂和/或胞质分裂[21].

BUB1是丝氨酸/苏氨酸激酶并由BUB1基因编码,在有 丝分裂期间结合着丝粒。已经注意到过量表达的BUB1 与几种癌症及其较差的临床预后有关。王等人。[22] 表明BUB1的高表达与203名乳腺癌患者的无病生存率差 有关。另外,赵等人。[23]表明BUB1蛋白阳性率较高 意味着子宫内膜癌更晚期,分化程度更高。此外, Pinto等人。[24]表明发现BUB1的过表达与肿瘤的 Furhman等级和基因组拷贝数变化的数量基本相关。通 过从母细胞中分离出子细胞,BUB1也对染色体的准确 分配负有重要责任,而无需建立有丝分裂纺锤体检查 点和对齐染色体[25, 26].

单极纺锤体1(Mps1,也称为TTK),是一种磷酸化 丝氨酸的双特异性蛋白激酶/ 苏氨酸和酪氨酸[27].Mps1是SAC(主轴装配检查点) 的核心部分,是确保健康细胞增殖和精确分裂的关键 监测机制[28, 29].除了有丝分裂SAC调节,Mps1还在其 他过程中发挥作用,包括DNA

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[236799],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。