一種蛋白質冷凍電鏡密度圖結構檢測方法
2023-06-12 04:20:16 2
專利名稱:一種蛋白質冷凍電鏡密度圖結構檢測方法
技術領域:
本發明涉及ー種蛋白質冷凍電鏡密度圖結構檢測方法,屬於生物信息學領域,特別是冷凍電鏡密度數據的分析。
背景技術:
人類基因組工作草圖繪製完成後,生命科學進入後基因時代,結構生物學將處在具有戰略性的關鍵地位,在人類基因組測定之後,將進一歩集中研究蛋白質的結構與功能,特別是蛋白質的三維結構,這是掲示基因組功能的基本途徑。冷凍電鏡技術作為結構生物學重要的研究手段將扮演越來越重要的角色,冷凍電鏡對於具有ニ維晶體結構的生物樣品,能夠得到其高解析度的三維重構圖像,並直接用於解析其空間結構信息;對於非晶體的樣品,雖只能得到低解析度的三維重構圖,但可以為高解析度的X-射線晶體學和核磁共振波譜學所得的亞結構提供模型。對冷凍電鏡重構的密度數據分析,主要包含三個步驟可視化、分割和結構匹配。冷凍電鏡的密度圖雖然包含生物大分子的結構,但密度數據的精度較 低,不能直接獲取其ニ級結構。而通過X射線獲取的小分子晶體結構是高精度的,包含分子的原子組成以及原子之間的連接關係。一個翻譯蛋白質結構的主要方法就是把這種已知結構的晶體結構通過坐標變換放入密度圖中,如果兩者匹配的很好,則可以推測出密度圖的結構和它的原子模型。目前,已有軟體的匹配算法単一,計算量大,效果有待提高,很大程度還靠手工匹配。
發明內容
針對上述問題,本發明的目的在於提出了ー種蛋白質冷凍電鏡密度圖結構檢測方法,根據密度圖的物理屬性,用冷凍電鏡密度圖的關鍵點來代表冷凍電鏡密度圖,用高密度的原子代表原子模型,使用迭代法計算出兩者點的對應關係,把匹配問題轉化成絕對定向問題,然後求解出其絕對定向坐標變換,在每次迭代中利用絕對定向法計算出變換矩陣的解析解,這裡變換矩陣包括旋轉矩陣和平移矩陣。用此變換矩陣乘以原子模型當前位置矩陣,從而得到原子模型的新位置,即匹配結果。所以匹配問題的核心問題就是求解變換矩陣,即旋轉矩陣和平移向量。本發明的技術方案為ー種蛋白質冷凍電鏡密度圖結構檢測方法,其步驟為I)選取原子模型中符合設定條件的原子表示所選原子模型;其中,所選原子記為集合P,將集合P中的姆一點p(x,1,z)對應的四元數用P(X,I, z)表示;2)選取待測蛋白質冷凍電鏡密度圖中的關鍵點並將其添加到集合M中;所述關鍵點為密度圖中某一點的密度值在該點鄰域中兩個方向均為最大值的點;3)對於集合P中的每一點P,計算集合M中距離點P最近的點g作為點P的對應點並將其添加到集合G中,得到與集合P對應的集合G ;4)根據集合P、集合G計算所述原子模型的旋轉四元數q和平移向量t ;
5)根據旋轉四元數q計算旋轉矩陣R,並根據R、t計算所述原子模型中每一原子坐標轉換後的位置,得到所述原子模型與冷凍電鏡密度圖的匹配結果;6)根據滿足要求的匹配結果得到待測蛋白質冷凍電鏡密度圖的結構。進ー步的,所述符合設定條件的原子為所述原子模型中的高質量原子。進ー步的,計算所述原子模型的旋轉四元數q和平移向量t的方法為I)初始化ー表示剛體轉換的旋轉四元數q[°] = I,一平移向量t[°] = O ;2)循環計算旋轉四元數q和平移向量t,直到設定循環次數W ;其中,毎次循環計算的方法為a)PM = q[-i]p[w-i](q[w-i]r+t[w-i] ;pM 為集合 p = {ル…,pJ 中所有四元數 p(x,y,z)構成的矩陣;
b)計算與集合P對應的點集G =G = UUCP ,ル0};CP ,M)表示集合M中與P距尚最近的點;c)根據Horn四元數絕對定向算法計算第w次循環的旋轉四元數q[w]和平移向量tM;3)將最終輸出的旋轉四元數作為所述原子模型的旋轉四元數q,對應的平移向量作為所述原子模型的平移向量t。
Xix X進ー步的,採用公式·^ =R* 2 * ノ計算所述原子模型中每一原子坐標轉換後
_1 I [I」[I
的位置;其中(X,1,Ζ)為所述原子模型中原子的坐標,ti、t2、t3分別是平移變量t的三個分量,U丨,1' ,Z')為轉換後的位置。進ー步的,通過公式Il P-CP(p,M) Il= mm{||屍-ぎ||}計算集合M中距離點p最近的
點g ^^,CP(ρ,Μ)表示M中與P距離最近的點,I p-g I表示點pep與點g e M的歐拉距離。首先簡單講述ー下四元數和絕對定向概念。四元數定義為q = (q0, qx, qy, qz) = q0+qxi+qy j+qzk其中i, j, k類似於複數,滿足如下規則i2 = -I, j2 = -I, k2 = -Iij = k, jk = i, ki = jji = _k, kj = -i, ik = -j根據應用需要,四元數還可以表示為ー個實數r和一個向量r = (x,y,z)複合數q = [r, v]可以把三維空間一點p (X,y, ζ)視為無純量的四元數xi+yj+zk。四元數旋轉和旋轉矩陣的關係因為OpenGL中的旋轉是用旋轉矩陣表示的,因此用OpenGL繪製出旋轉後的物體需要用到旋轉矩陣,根據四元數的性質,可以得到qPq = (QP)q = Qt (QP) = (QtQ)P
其中
權利要求
1.ー種蛋白質冷凍電鏡密度圖結構檢測方法,其步驟為 1)選取原子模型中符合設定條件的原子表示所選原子模型;其中,所選原子記為集合P,將集合P中的姆一點p(x,y,z)對應的四元數用p(x, y, z)表示; 2)選取待測蛋白質冷凍電鏡密度圖中的關鍵點並將其添加到集合M中;所述關鍵點為密度圖中某一點的密度值在該點鄰域中兩個方向均為最大值的點; 3)對於集合P中的姆一點P,計算集合M中距離點P最近的點g作為點P的對應點並將其添加到集合G中,得到與集合P對應的集合G ; 4)根據集合P、集合G計算所述原子模型的旋轉四元數q和平移向量t; 5)根據旋轉四元數q計算旋轉矩陣R,並根據R、t計算所述原子模型中每一原子坐標轉換後的位置,得到所述原子模型與冷凍電鏡密度圖的匹配結果; 6)根據滿足要求的匹配結果得到待測蛋白質冷凍電鏡密度圖的結構。
2.如權利要求I所述的方法,其特徵在於所述符合設定條件的原子為所述原子模型中的高質量原子。
3.如權利要求I或2所述的方法,其特徵在於計算所述原子模型的旋轉四元數q和平移向量t的方法為 1)初始化ー表示剛體轉換的旋轉四元數q[°]= I,一平移向量tM = O ; 2)循環計算旋轉四元數q和平移向量t,直到設定循環次數W;其中,每次循環計算的方法為 a)PM=(q[w-i])*+t[w-i] ;PM 為集合 ρ = {Pi, ...,pJ 中所有四元數 p(x,y,z)構成的矩陣; b)計算與集合P對應的點集G= [}lx{CP(pΜ)};ひ ,ルO表示集合M中與ρ距離最近的點; c)根據Horn四元數絕對定向算法計算第w次循環的旋轉四元數q[w]和平移向量t[w]; 3)將最終輸出的旋轉四元數作為所述原子模型的旋轉四元數q,對應的平移向量作為所述原子模型的平移向量t。
4.如權利要求3所述的方法,其特徵在於採用公
5.如權利要求I所述的方法,其特徵在於通過公式IlP-CP(PM) Il= mm{|| ρ -g ||}計算集合M中距離點ρ最近的點g(ρ,Μ)表示M中與ρ距離最近的點,I p-g I表示點P e P與點g e M的歐拉距離。
全文摘要
本發明公開了一種蛋白質冷凍電鏡密度圖結構檢測方法,屬於生物信息學領域。本方法為1)選取原子模型中符合條件的原子表示所選原子模型;2)選取待測蛋白質冷凍電鏡密度圖中的關鍵點並將其添加到集合M中;3)對於集合P中的每一點p,計算集合M中距離點p最近的點g作為點p的對應點並將其添加到集合G中;4)根據集合P、G計算原子模型的旋轉四元數q和平移向量t;5)根據旋轉四元數q計算旋轉矩陣R,並根據R、t計算原子模型中每一原子坐標轉換後的位置,得到原子模型與密度圖的匹配結果;6)根據滿足要求的匹配結果得到待測蛋白質冷凍電鏡密度圖的結構。本發明魯棒性好,模型數據不必與密度數據重合,計算量小、易於編程實現。
文檔編號G06F19/16GK102682223SQ20111034250
公開日2012年9月19日 申請日期2011年11月2日 優先權日2010年11月30日
發明者劉俊, 單桂華, 田東, 謝茂金, 遲學斌 申請人:中國科學院計算機網絡信息中心