蛋白質(zhì)二級(jí)結(jié)構(gòu)的不斷發(fā)展
隨著后基因組時(shí)代的到來,越來越多的蛋白質(zhì)序列不斷被發(fā)現(xiàn),給蛋白質(zhì)的二級(jí)結(jié)構(gòu)研究帶來巨大的挑戰(zhàn)和研究空間。而依靠傳統(tǒng)的實(shí)驗(yàn)方法很難獲取大規(guī)模蛋白質(zhì)的二級(jí)結(jié)構(gòu)信息。目前,采用生物信息學(xué)手段仍然是獲得大部分蛋白質(zhì)二級(jí)結(jié)構(gòu)的途徑。近年來,許多研究者通過構(gòu)建用于二級(jí)結(jié)構(gòu)預(yù)測(cè)的蛋白質(zhì)數(shù)據(jù)集,計(jì)算、提取蛋白質(zhì)的各種特征信息,并采用不同的預(yù)測(cè)算法預(yù)測(cè)蛋白質(zhì)的二級(jí)結(jié)構(gòu)得到了快速的發(fā)展。本文擬從蛋白質(zhì)的特征信息的提取與篩選、預(yù)測(cè)算法以及預(yù)測(cè)效果的檢驗(yàn)方法等方面進(jìn)行綜述,介紹蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)領(lǐng)域的研究進(jìn)展。相信隨著基因組學(xué)、蛋白質(zhì)組學(xué)和生物信息學(xué)的不斷發(fā)展,蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)會(huì)不斷取得新突破。
蛋白質(zhì)的二級(jí)結(jié)構(gòu)是蛋白質(zhì)構(gòu)建三級(jí)結(jié)構(gòu)和發(fā)揮正常功能的基礎(chǔ),故研究蛋白質(zhì)的二級(jí)結(jié)構(gòu)對(duì)于了解蛋白質(zhì)的三級(jí)結(jié)構(gòu)和功能很重要。隨著后基因組時(shí)代的到來,迅速增加的蛋白質(zhì)序列信息與蛋白質(zhì)二級(jí)結(jié)構(gòu)研究之間的差距越來越明顯。因此,采用生物信息學(xué)手段研究一種能夠快速高效地分析蛋白質(zhì)的二級(jí)結(jié)構(gòu)的預(yù)測(cè)方法很有必要。目前,預(yù)測(cè)蛋白質(zhì)的二級(jí)結(jié)構(gòu)主要基于如下兩個(gè)方面。一是如何有效地獲取蛋白質(zhì)的特征信息。在過去幾十年中,許多研究者利用不同的特征信息來研究蛋白質(zhì)的二級(jí)結(jié)構(gòu)。其中最常見的就是基于蛋白質(zhì)的氨基酸序列構(gòu)建出的特征信息.但也有研究者指出,僅僅將氨基酸組成作為預(yù)測(cè)二級(jí)結(jié)構(gòu)的特征信息會(huì)丟失蛋白質(zhì)的一級(jí)結(jié)構(gòu)特征信息,即氨基酸排列順序。蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)是蛋白質(zhì)結(jié)構(gòu)組學(xué)研究的重點(diǎn)問題之一,也是目前生物信息學(xué)研究中的重要分支領(lǐng)域。
蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)研究經(jīng)過數(shù)十年的發(fā)展,加上蛋白質(zhì)相關(guān)數(shù)據(jù)庫(kù)的不斷擴(kuò)充和完善,現(xiàn)在該研究領(lǐng)域已經(jīng)越來越完善。但是,蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)研究仍然存在許多不足點(diǎn)。為了更好地預(yù)測(cè)蛋白質(zhì)的二級(jí)結(jié)構(gòu),目前研究者越來越傾向于將各種特征信息綜合起來。雖然這種方式可以用更多的特征信息來表示被預(yù)測(cè)的蛋白質(zhì)。但如果特征信息過多,同樣會(huì)造成冗余信息增加,引起特征維數(shù)過高,勢(shì)必引起預(yù)測(cè)準(zhǔn)確率不升反降的效果。蛋白質(zhì)的二級(jí)結(jié)構(gòu)預(yù)測(cè)不僅取決于蛋白質(zhì)特征信息的提取,而且與預(yù)測(cè)算法的選擇緊密相關(guān)。當(dāng)待測(cè)蛋白質(zhì)數(shù)據(jù)集中蛋白質(zhì)的序列相似度很低時(shí),預(yù)測(cè)算法及其參數(shù)的選擇更加重要。目前,有許多算法都被應(yīng)用于蛋白質(zhì)的二級(jí)結(jié)構(gòu)預(yù)測(cè)中。中國(guó)糧油儀器網(wǎng) http://www.pfyin.com/