基於可變角距離qea算法的蛋白質hp模型求解方法
2023-07-28 04:54:36 1
專利名稱:基於可變角距離qea算法的蛋白質hp模型求解方法
技術領域:
本發明屬於生物信息技術領域,涉及基於可變角距離QEA算法的蛋白質HP模型求解方法。
背景技術:
蛋白質摺疊問題,即蛋白質結構預測問題,是生物信息學領域的核心問題之一。蛋白質摺疊問題是研究蛋白質天然結構如何形成,即具有一定胺基酸序列的多肽鏈如何逐步形成蛋白質所特有的空間結構。目前許多「構象病」或稱「摺疊病」都是由蛋白質摺疊異常造成分子聚集甚至沉澱引起的,例如:老年痴呆症(蛋白質構象變化)、囊性纖維病變(蛋白質不能摺疊)、家族性高膽固醇症(蛋白質錯誤摺疊)、家族澱粉樣蛋白症(蛋白質沉澱)等等。因此深入理解蛋白質摺疊機制已變得越發迫切。隨著蛋白質摺疊研究的深入,蛋白質所具有的生物學功能在很大程度上取決於蛋白質的空間摺疊結構,因此了解蛋白質的空間結構在生物學領域具有重要意義。通過實驗手段,可以測出蛋白質鏈的構成,但要觀測蛋白質的空間結構卻非常困難。研究表明,根據蛋白質的胺基酸序列和能量模型,利用理論計算方法對蛋白質結構進行預測是可行的方案。目前,該方案已成為蛋白質工程中的一個重要工具。由於真實蛋白質摺疊問題的複雜性太高,理論界提出了一些簡化模型。其中,研究最為廣泛的是Dill等提出的HP格點模型。該模型把二十種胺基酸分為兩類:疏水型胺基酸(H)和親水型胺基酸(P)。每個胺基酸單體可以看作一個小球,H記為黑球,P為白球。這樣,一條胺基酸序列可以看作是一條由黑白球組成的鏈,相鄰兩球的球心距離為I。HP格點模型把胺基酸鏈無重疊地擺放到二維或三維單位網格上,要求每個球必須放到一個格點上,且鏈上相鄰的兩球 在放到格點平面或空間後位置仍相鄰。HP模型的能量函數為:
權利要求
1.基於可變角距離QEA算法的蛋白質HP模型求解方法,其特徵在於,所述方法的具體步驟如下: 步驟A,初始化量子種群Q (t),其中t為進化代數,初始值為O ; 步驟B,測量量子種群Q(t),生成方向解種群moveDirect (t), 一個個體代表一個構型; 步驟C,檢查方向解,判斷是否構型出現閉環;若出現閉環,則構型無效,利用回退法修復; 步驟D,對種群moveDirect (t)計算適應度值; 步驟E,保存種群moveDirect (t)中的最優解bestSoFar ; 步驟F,判斷最優解bestSoFar是否為公開的最小值或t達到了最大代數,若滿足,則終止算法;否則,繼續下一步; 步驟G,採用可變角距離量子旋轉門進化方法,更新Q (t),生成新一代量子種群; 步驟H,進化代數t加I; 步驟I,測量量子種群Q(t),生成新一代方向解種群moveDirect (t); 步驟J,檢查方向解,判斷構型 是否出現閉環;若出現閉環,則構型無效,利用回退法修復; 步驟K,對種群moveDirect (t)計算適應度值; 步驟L,將bestSoFar和moveDirect (t)中的最優解賦值給bestSoFar ; 步驟M,判斷是否滿足牽引條件,若滿足,則對種群moveDirect (t)進行牽引,並計算適應度值,將bestSoFar和moveDirect (t)中的最優解賦值給bestSoFar ;轉至步驟F。
2.根據權利要求1所述的基於可變角距離QEA算法的蛋白質HP模型求解方法,其特徵在於,所述步驟A中,初始化量子種群,使得測量量子比特時為O或I的概率均為1/2。
3.根據權利要求1所述的基於可變角距離QEA算法的蛋白質HP模型求解方法,其特徵在於,所述步驟B中,測量量子種群中的量子比特,生成二進位比特,如果為00,對應的方向值為1,表示方向向上;如果為01,對應的方向值為i,表示方向向右;如果為10,對應的方向值為-1,表示方向向下;如果為11,對應的方向值為_i,表示方向向左;進而產生方向解種群;其中方向值1、-1、1、_i均是複數,i是虛數單位。
4.根據權利要求1所述的基於可變角距離QEA算法的蛋白質HP模型求解方法,其特徵在於,所述步驟C中,所述構型出現閉環是指:根據方向解計算任意一段方向值之和,若為O,則說明該構型出現閉環,該構型無效。
5.根據權利要求1所述的基於可變角距離QEA算法的蛋白質HP模型求解方法,其特徵在於,所述步驟C中,所述回退法修復是指:使衝突點選擇其它方向,如果與前面點仍有衝突則選擇其他方向;若所有方向都已嘗試,仍無法修復,則回退到前一個點,對該點進行修復嘗試,直至形成一個有效構型。
6.根據權利要求1所述的基於可變角距離QEA算法的蛋白質HP模型求解方法,其特徵在於,所述步驟D中,計算適應度值是指通過方向解查找在該構型鏈上不相連但空間上相鄰的黑球對個數,該數值乘以-1,即為該構型的能量。
7.根據權利要求1所述的基於可變角距離QEA算法的蛋白質HP模型求解方法,其特徵在於,所述步驟E中,最優解即是能量最低的個體。
8.根據權利要求1所述的基於可變角距離QEA算法的蛋白質HP模型求解方法,其特徵在於,所述步驟G中,可變角距離策略是指採用角距離對旋轉角度進行調整,在旋轉之前,首先要將方向解種群轉化成二進位比特的形式,再利用可變角距離進行量子旋轉進化;所述旋轉角度Θ j根據下式計算:
9.根據權利要求1所述的基於可變角距離QEA算法的蛋白質HP模型求解方法,其特徵在於,所述步驟M中,所述牽引條件是指最優個體10代未改變或每隔30代;若滿足該牽引條件,則對所有構型進行牽引。
全文摘要
本發明提出了基於可變角距離QEA算法的蛋白質HP模型求解方法,所述方法通過將基於可變角距離的量子進化算法運用到蛋白質二級結構預測中,在量子進化算法框架基礎上,引入可變角距離進化策略;在HP構型表示上採用靈活高效的方向解形式;為了增加方向解的多樣性引入一種方向牽引機制,從而使得本發明能夠高效率地找到蛋白質最低能量構型;所述方法採用方向解替代以往的坐標解,有利於無效閉環HP構型檢測和修復,從而提高方法執行速度。本發明方法使用了方向解形式、回退法、方向牽引策略、可變角距離等技術或策略,使得本發明效率上更優於其他方法。
文檔編號G06F19/16GK103116712SQ20131004432
公開日2013年5月22日 申請日期2013年2月4日 優先權日2013年2月4日
發明者劉文杰, 王芳, 鄭玉, 季賽 申請人:南京信息工程大學