网页化查询服务生物信息学博硕生毕业大论文的摘要(知网可查到)

以下展示几篇密切相关网页化查询服务生物信息学博硕生毕业大论文摘要(知网可查到)


网页化查询服务生物信息学博硕生毕业大论文的摘要(知网可查到)


猪miRNA调控蛋白质相互作用“双色网络”预测及呼吸道病毒病系统生物学分子机制分析

王芬(2014) 张德礼

摘 要

蛋白质相互作用是细胞中最重要的功能元件之一。目前,科学家特别关注miRNA调控蛋白质相互作用双色网络的研究。这不仅有助于理解miRNA在蛋白质相互作用网络中的微调作用,而且也可以为疫病诊断提供科学依据。高致病性猪繁殖与呼吸综合征(HP-PRRS)和猪流感(SI)严重危害养猪业。在本研究中,我们预测出猪的蛋白质相互作用网络,并构建出miRNA调控蛋白质相互作用的双色网络,研究了高致病性猪繁殖与呼吸综合征病毒(HP-PRRSV)和甲型H1N1亚型猪流感病毒(SIV)感染猪的系统生物学分子机制,为理解疾病的生物过程提供参考。论文的研究内容如下:

(1)本研究使用三种方法预测猪的蛋白质相互作用网络:基于同源比对、domain-motif互作(D-MIST)和motif-motif互作(M-MIST)的方法,分别预测出20213、331484和218705对蛋白质相互作用,并将它们合并为一个网络,得到567441对互作。接着对网络的拓扑特性进行分析,并用PFAM DOMAIN注释和GO注释对网络进行验证。在PFAM DOMAIN验证中,分别有70、10495和863对互作与PFAM DOMAIN互作对相关,为便于比较,我们分别建立以上三种方法的10000个随机网络,分别有4.24、66.79和44.26对与PFAM DOMAIN互作对相关。在GO注释中,分别有52.68%、75.54%和27.20%的互作对共享GO术语。但在构建的三种10000个随机网络中,没有任何随机网络的百分率达到我们预测的网络。接着,我们计算预测结果的准确性和精确性,准确性分别是0.92、0.53和0.50,精确性分别是0.93、0.74和0.75,说明预测的网络比较可靠。本研究对于以后研究蛋白质的功能也有相当大的价值。本研究还建立了猪的蛋白质相互作用对外共享网站http://pppid.songbx.me/,互作数据以及打分情况均已分享在该网站上。最后,将本课题组前期获得的HP-PRRSV感染仔猪的的差异表达蛋白质数据和磷酸化蛋白质数据用我们构建的蛋白质相互作用网络进行分析,发现可能参与HP-PRRS发病过程的关键蛋白,分别是Q6QA25(Tropomyosin alpha-3 chain)、Q29214(60S acidic ribosomal protein P0)、Q31068(MHC PD14 transplantation antigen)、Q2XQY5(Tropomyosin 3)、Q8SPS7(Haptoglobin)、Q69DK8(Complement C1s subcomponet)和P01965(Hemoglobin subunit alpha),可能作为治疗的靶标;通过GO富集分析发现激素反应、受伤反应、对温度刺激的反应、呼吸系统发育、炎症反应等生物过程可能对于阐明HP-PRRS的发病机制起关键作用。

(2)首次建立猪miRNA调控蛋白质相互作用双色网络,得到282867个猪miRNA调控的蛋白质相互作用,并对其进行通路分析,发现通路之间存在一些相互作用。另外,本研究还预测出2457个猪的miRNA调控疾病相关蛋白质相互作用。将100个文献报道的疾病相关miRNA映射到miRNA调控疾病相关蛋白质相互作用中,共得到2040个miRNA调控疾病蛋白相互作用,说明预测结果的可靠性较高。将这2040个miRNA调控疾病蛋白质相互作用进行GO富集分析,发现在生物过程中,它们的功能主要体现在应激反应、癌症、炎症等方面,再一次说明这些蛋白质相互作用与疾病相关。因此,该miRNA调控疾病蛋白质相互作用网络为疾病诊治和药物研发提供了一定的理论依据。最后,将本实验室前期测得的HP-PRRSV感染仔猪肺脏、颌下淋巴结和血清的差异表达蛋白质应用于构建的miRNA调控蛋白质相互作用双色网络,发现可能作为治疗HP-PRRS靶标的蛋白质和miRNA,分别是B8XSI6(Phosphatase and tesin-like protein)、P01965(Hemoglobin subunit alpha)、P20305(Gelsolin)、Q31068(MHC PD14 transplantation antigen)、Q6QAQ1(Actin, cytoplasmic 1)和A1XSY8(E3, SUMO-protein ligase EGR2)以及miRNA ssc-miR-145-3p、ssc-miR-30a-5p、ssc-miR-30b-5p、ssc-miR-30c-5p、ssc-let-7a、ssc-let-7c、ssc-let-7d-5p、ssc-let-7e、ssc-let-7f、ssc-let-7g、ssc-let-7i、ssc-miR-181c、ssc-miR-182和ssc-miR-23a。

(3)对HP-PRRSV和H1N1亚型SIV感染仔猪发病过程的系统生物学分子机制进行分析。从猪的蛋白质相互作用网络和miRNA调控的网络中提取出本课题组前期用HP-PRRSV和H1N1病毒感染仔猪实验鉴定出的肺脏、颌下淋巴结、血清差异蛋白、磷酸化蛋白和差异miRNA参与的网络。通过对网络分析发现差异蛋白B8XSI6(Phosphatase and tesin-like protein)、Q2XQY5(Tropomyosin 3)、B5APU3(Actin-related protein 2-like protein)、Q31068(MHC PD14 transplantation antigen)、Q29214(60S acidic ribosomal protein P0)、P09571(Serotransferrin)、Q04967(Heat shock 70kDa protein 6)、Q6QA25(Tropomyosin alpha-3 chain)、P01965(Hemoglobin subunit alpha)、B5APU8(Actin related protein 2/3 complex subunit 3)、P20305(Gelsolin)、Q69DK8(Complement C1s subcomponet)、Q8SPS7(Haptoglobin)和Q9GMA7(Alpha-1-antichymotrypsin 1)以及磷酸化蛋白P15981(SLA classⅡ histocompatibility antigen, DQ haplotype D alpha chain )、Q4AC39(MHC class I antigen)、Q547Q5(MHC classⅡantigen )、Q19LF1(Nuclear receptor corepressor 2)、Q32YV9(Proteasome 26S subunit non-ATPase 4)和Q29214(60S acidic ribosomal protein P0)在HP-PRRSV感染仔猪的发病过程中具有重要的作用。ssc-miR-15a、ssc-miR-15b、ssc-miR-16、ssc-miR-195、ssc-miR-30a-5p、ssc-miR-30b-5p、ssc-miR-30c-5p、ssc-miR-181c、 ssc-miR-20a、ssc-miR-20b、ssc-miR-32,ssc-miR-153和ssc-miR-145-3p以及 7个miRNA协同调控蛋白质模块在HP-PRRS的发病机制中具有重要的作用。在miRNA调控差异磷酸化蛋白网络中鉴定出11个miRNA共同调控B6CVD6(Thioredoxin domain-containing 4),推测这个调控可能是HP-PRRS发生的重要因素。并且识别出感染H1N1亚型SIV各个时间点差异miRNA调控的差异互作蛋白主要参与免疫反应、激素反应、繁殖、求偶行为和交配行为等过程。以上研究可为从系统水平上了解呼吸道病毒感染仔猪的发病机制提供理论依据。


网页化查询服务生物信息学博硕生毕业大论文的摘要(知网可查到)


流感病毒多重序列比对数据库构建与重配规律分析

刘敏(2012)张德礼

摘 要

流行性感冒病毒,简称流感病毒,是对人类危害最大的几种病毒之一,具有较高的致病率与致死率。流感病毒能够导致季节性流行性感冒,严重时能引发世界性的流感大流行。20世纪全球一共出现过3次世界性流感大流行(即1918年H1N1、1957年H2N2和1968年H3N2流感大流行)。此外,2009年墨西哥流感也是由甲型H1N1流感病毒引发的。为了减少流感疫情给人类带来的损失,人类已经在抗流感药物和疫苗方面投入了大量的人力和资金。同时,大规模流感病毒基因组测序工程和全球各大实验室已经产生了大量的流感病毒序列数据,人们可以越来越方便地获取流感病毒序列数据资源及其相关分析工具。

对于许多研究分析而言,多重序列比对都是必不可少的。但由于各种技术原因,进行高精度成千上万条序列的多重序列比对是比较困难的。本研究利用邻接策略成功构建了手工编辑的流感病毒多重序列比对数据库,旨在覆盖全部公开序列数据,将多重序列比对问题转变为序列检索问题,从而进行快速、准确和大规模的多重序列比对分析,加速流感病毒序列数据收集处理工作。

甲型流感病毒基因组是分节段的,一共包含8条负链RNA。因此,当多株流感病毒同时侵染同一细胞时,由于片段包裹错误,将来自不同毒株的片段包裹到同一子代毒株中,进而形成重配毒株。本研究采用重配模拟的方法,对甲型H3N2亚型流感毒株序列数据进行了重配频率评估。使用线性回归和回归预测分析发现,H3N2亚型流感病毒在整个进化历程中可能并不存在重配偏好,即从全局角度上来看,在毒株重配过程中基因组片段更倾向于随机组合。

本研究首次引入重配群划分模型,将流感病毒重配分析问题转变为重配群划分问题。通过系统发育分析、统计分析或者基因型分析都能对流感病毒重配关系进行一定的分析,最终都能将病毒毒株集合划分为一个个相互独立的群体。因此,重配群划分分析在重配分析中具有重要的地位。另外,依据Rabadan等人介绍的统计方法,结合聚类分析和群体结构划分得到两种重配群划分方法:重配群聚类和重配群随机划分。前者是将重配群划分问题转变为聚类分析问题,通过重配距离将各个毒株划分到不同的分枝上,同一重配群中的毒株倾向于具有较小的重配距离。后者则是通过构造一个损失函数来衡量一个重配群划分的合理性,使得合理的重配群划分具有最小的损失,从而将重配群随机划分转变为一个关于损失函数的最优化问题。


网页化查询服务生物信息学博硕生毕业大论文的摘要(知网可查到)


鸡microRNA新基因预测与检索自动化软件系统及Web可视化

张飞(2011)张德礼

摘 要

MicroRNA是在真核生物中发现的内源性的非编码RNA,简称miRNA,长度大约为22至25个核苷酸。miRNA的主要作用是在基因转录后水平发挥调节作用,是一种重要的调节分子。它参与生命过程中一系列调节。miRNA的作用机制是通过作用于相应靶标来参与细胞调控。每个microRNA可以有多个靶基因,而几个miRNA也可以调节同一个基因。这种复杂的调节网络既可以通过一个miRNA来调控多个基因的表达,也可以通过几个miRNA的组合来精细调控某个基因的表达。

自从第一个miRNA发现至今,很短的十几年时间内,有关miRNA的研究突飞猛进。目前,miRNA数据库(miRBase17.0)中的miRNA数量已达到15172条,虽然每一种生物的miRNA总数难以确定,生物信息学研究表明,miRNA占动物基因总数的1-5%,鸡的miRNA总数约为1000条(Stark 2005)。因此,还存在大量鸡miRNA未被发现。

鸡是一种重要的经济动物,在人们生活生产中占有重要的地位,同时它也是重要的人类疾病研究模型。在miRBase17.0中,已经收录人类miRNA1424条,但是鸡的miRNA只有499条。已经收录在miRBase中的鸡的miRNA多数都是基于其保守性发现的,而基于序列保守性预测miRNA的方法准确性较低,而且速度太慢,难以在短时间内预测出大量miRNA。另一方面,基于序列保守性的预测方法也无法预测已经发现miRNA没有同源性的miRNA。本实验中,我们综合了以往关于miRNA研究发现的miRNA所具有的特征,将其抽象成相应的数学模型,作为筛选pre-miRNA的条件,采用Java语言开发了预测miRNA的软件包:GlaMiRFilter。另外,还基于支持向量机开发了一款鸡的pre-miRNA分类器:GluMiRPred。最后,我们还采用JSP语言开发了预测鸡的新miRNA的网络平台,为进一步研究鸡的miRNA提供支持。

本研究利用miRBase中收录的鸡的pre-miRNAs构建了训练集和测试集,我们给予SVM训练得到预测模型Glu_train_300_125并利用测试集对我们的预测软件进行评价,发现其敏感度达到100%,特异性是88.4%,准确性是90.3%。 这些结果证明GluMiPRed是一个有效区分鸡pre-miRNA的分类器,该分类器具有较高的准确性。最后,我们利用GluMiPRed对鸡的基因组进行扫描,预测得到了7471条候选鸡pre-miRNAs。目前,还没有一款miRNA预测软件是专门针对鸡的。为了验证我们开发的软件对鸡miRNA预测具有特异性,我们利用猪的miRNA构建了测试集进行检验,得到的结果是该软件在猪的数据集上的敏感度只有74%,从而证明该软件对鸡的miRNA预测具有特异性。

结 论

1.预测得到7471条鸡pre-miRNA候选序列。利用GluMiRFilter和GluMiRPred对鸡基因组序列进行切割、筛选,预测得到了7471条可能的鸡pre-miRNA。

2.开发出鸡pre-miRNA筛选软件包: GluMiRFilter。GluMiRFilter能够根据pre-miRNA特有的序列结构特征,对具有类似发夹结构的序列进行筛选,去除不具有真正pre-miRNA序列结构特征的序列。

3.开发出基于SVM预测鸡pre-miRNA的分类器:GluMiRPred。由于鸡pre-miRNA序列数量很少,给鸡pre-miRNA分类器的构建带来很大的困难。我们经过不断尝试,构建出一个完全以鸡的序列为基础的鸡pre-miRNA分类器:GluMiRPred。

4.开发出预测鸡miRNA的web平台。为提高鸡miRNA预测软件的易用性,我们还开发出B/S模式的web平台。用户只需要通过浏览器就可以访问该系统http://vir.nwsuaf.edu.cn。


网页化查询服务生物信息学博硕生毕业大论文的摘要(知网可查到)


功能相似蛋白质挖掘及蛋白质相互作用网络预测平台

宋宝兴(2013) 张德礼

摘 要

蛋白质之间的相互作用有的发生于蛋白质复合体内部,有的仅仅是多个或两个蛋白质之间短暂的相互作用。这种蛋白质之间的相互作用及其不断的变化对生物体的功能、新陈代谢发挥着十分核心的作用。许多蛋白质之间的两两相互作用整合在一起就形成了蛋白质相互作用网络。蛋白质相互作用(网络)的预测和分析对于揭示生物学奥秘起着十分重要的作用。

本文探讨了一种基于蛋白质相互作用网络挖掘物种内功能相似蛋白质的方法。使用图论为计算模型,应用最短路径算法,以蛋白质相互作用网络和蛋白质序列作为输入数据,挖掘到了大量功能相似蛋白质。通过与传统的序列比对算法比较分析发现,大量的功能相似但是序列相似性较低的蛋白质得到展现。另外通过功能相似蛋白质和序列相似性的关系比较分析,验证了同源和趋同进化难以区分这一理论,并且结果中有很多这种二者之间关系分不清是同源还是趋同进化的蛋白质对。与物种间的功能相似蛋白质相比较,物种内功能相似蛋白质可能会涉及到较少的免疫排斥反应,在医药生产、工业应用方面具较大的应用潜力。

蛋白质相互作用网络是由许多个蛋白质之间的两两相互作用整合而来的,蛋白质相互作用的预测已经成为一种需求广泛的研究技术,也是一个被广泛研究的领域,现在已经有很多不同的理论被应用于蛋白质相互作用的预测。由于每种理论都有各自的侧重点,相关研究发现基于单纯一种理论的蛋白质预测方法会有较高的假阴性,因此通常要同时采用几种方法进行综合分析。但是现有的蛋白质相互作用预测方法往往对输入数据的要求复杂,操作繁琐,有的还没有成熟的软件。输入数据简单、操作便捷、易用易懂的蛋白质相互作用预测方法亟待开发。我基于蛋白质相互作用位点附近序列的保守性,开发了一种只需要蛋白质序列作为输入数据的算法,基于同源聚类模型开发了一套只需要蛋白质序列作为输入数据的软件,朝蛋白质相互作用预测易用性这个方向迈出了重要的一步。

蛋白质相互作用(网络)的预测是一种十分耗费计算资源的工作,现有的很多方法没有相应的软件发表,而是只给出了算法。虽然有一些运行在命令行模式下的软件发表,但是这类软件的操作方式往往令普通用户望而却步。而用户体验较好的软件设计方式往往又满足不了这类工作巨大计算量的需要。因此我们开发了包括基于蛋白质相互作用特征序列保守性、蛋白质二级结构保守性、同源聚类分析等方法的一整套蛋白质相互作用预测的在线服务,并架设在配置较高的网络服务器上。通过这种方式既解决了用户体验的问题、也解决了蛋白质相互作用网络预测和分析对较大计算量的需求。

最后以小麦为例,对在线平台进行了测试,验证了蛋白质相互作用网络预测和基于蛋白质相互作用网络挖掘物种内功能相似蛋白质两个主要功能模块整合在一起使用的可能性。

结 论

本文采用图论模型,使用蛋白质相互作用网络数据进行了物种内功能相似蛋白质的挖掘。经过对不同进化等级的六个物种,来自两个数据库的数据进行预测,使用TO方法证明这种方法的可靠性。对结果分析发现同源和趋同进化蛋白质有时很难区分。

利用蛋白质结合位点附近的序列保守性构建了可用于蛋白质相互作用预测的矩阵。蛋白质相互作用的预测往往需要的信息繁杂,计算量较大,我构建了一种仅仅依靠序列信息对蛋白质相互作用进行预测的方法。

最后开发了一个蛋白质相互作用预测和基于蛋白质相互作用网络挖掘物种内功能相似蛋白质的在线服务。通过各种最新的可视化技术,使得这一类的分析变得稳定、用户友好。


分享到:


相關文章: