蛋白质的β-发夹、β(γ)-转角及四类简单超二级结构预测
由于蛋白质的功能与其结构是密切相关的,因此研究蛋白质的结构是获取功能信息的重要手段。随着人类基因组计划的顺利实施,蛋白质序列信息的积累速度远快于蛋白质结构数据的增长速度。
然而,通过实验手段确定蛋白质的结构,不但成本高、耗时,而且实验中还会遇到一些目前无法解决的技术困难,因此人们非常希望能利用理论计算的方法直接从序列信息预测蛋白质结构,这也是生物信息学研究的重要课题。目前,直接从序列信息预测蛋白质的三级结构还很困难。
由于局域结构有着较强的序列信号,且在三级结构中大量存在、频繁出现,对蛋白质的折叠、识别和稳定性起重要作用,因此,局域结构的预测可以简化结构预测问题,是蛋白质三级结构预测重要的中间步骤。本文主要研究蛋白质局域结构中超二级结构的预测,重点研究β-发夹模体的预测;研究了部分规则二级结构中β-转角和γ-转角的预测。
1.提出了一种新的预测算法一基于离散增量的支持向量机算法,用该算法首次对超二级结构数据库(ArchDB40)中β-发夹模体进行了预测,取得较好效果。2.利用离散增量和序列打分值构成的向量来表示序列信息,将离散增 ...
附件列表