蛋白質二級結構的不斷發展
隨著后基因組時代的到來,越來越多的蛋白質序列不斷被發現,給蛋白質的二級結構研究帶來巨大的挑戰和研究空間。而依靠傳統的實驗方法很難獲取大規模蛋白質的二級結構信息。目前,采用生物信息學手段仍然是獲得大部分蛋白質二級結構的途徑。近年來,許多研究者通過構建用于二級結構預測的蛋白質數據集,計算、提取蛋白質的各種特征信息,并采用不同的預測算法預測蛋白質的二級結構得到了快速的發展。本文擬從蛋白質的特征信息的提取與篩選、預測算法以及預測效果的檢驗方法等方面進行綜述,介紹蛋白質二級結構預測領域的研究進展。相信隨著基因組學、蛋白質組學和生物信息學的不斷發展,蛋白質二級結構預測會不斷取得新突破。
蛋白質的二級結構是蛋白質構建三級結構和發揮正常功能的基礎,故研究蛋白質的二級結構對于了解蛋白質的三級結構和功能很重要。隨著后基因組時代的到來,迅速增加的蛋白質序列信息與蛋白質二級結構研究之間的差距越來越明顯。因此,采用生物信息學手段研究一種能夠快速高效地分析蛋白質的二級結構的預測方法很有必要。目前,預測蛋白質的二級結構主要基于如下兩個方面。一是如何有效地獲取蛋白質的特征信息。在過去幾十年中,許多研究者利用不同的特征信息來研究蛋白質的二級結構。其中最常見的就是基于蛋白質的氨基酸序列構建出的特征信息.但也有研究者指出,僅僅將氨基酸組成作為預測二級結構的特征信息會丟失蛋白質的一級結構特征信息,即氨基酸排列順序。蛋白質二級結構預測是蛋白質結構組學研究的重點問題之一,也是目前生物信息學研究中的重要分支領域。
蛋白質二級結構預測研究經過數十年的發展,加上蛋白質相關數據庫的不斷擴充和完善,現在該研究領域已經越來越完善。但是,蛋白質二級結構預測研究仍然存在許多不足點。為了更好地預測蛋白質的二級結構,目前研究者越來越傾向于將各種特征信息綜合起來。雖然這種方式可以用更多的特征信息來表示被預測的蛋白質。但如果特征信息過多,同樣會造成冗余信息增加,引起特征維數過高,勢必引起預測準確率不升反降的效果。蛋白質的二級結構預測不僅取決于蛋白質特征信息的提取,而且與預測算法的選擇緊密相關。當待測蛋白質數據集中蛋白質的序列相似度很低時,預測算法及其參數的選擇更加重要。目前,有許多算法都被應用于蛋白質的二級結構預測中。中國糧油儀器網 http://www.pc256.com/