一種利用計算機模擬計算蛋白質與dna之間作用力的方法
2023-12-09 19:33:21 3
專利名稱:一種利用計算機模擬計算蛋白質與dna之間作用力的方法
技術領域:
本發明涉及一種利用計算機模擬計算蛋白質與DNA之間相互作用力大小的方法,尤其涉 及一種利用NAMD—2. 6和VMD-1. 8. 6軟體定量研究蛋白質與DNA之間相互作用力的方法。
技術背景蛋白質與DNA相互作用是生命活動過程的關鍵步驟,如轉錄因子對DNA上特定位點的識 別、啟動或關閉某個特定基因的轉錄,調控DNA的複製等。常規的實驗方法採用測定反應平 衡常數來檢測蛋白質與DNA之間的結合強度,也可通過原子力顯微鏡,對單分子進行操作, 將蛋白質與DNA分開為解離過程提供信息。但是由於實驗材料難以製備,無論是測定反應平 衡常數還是用原子力顯微鏡進行操作都不能很好的揭示蛋白質與DNA之間相互作用力的大 小,而分子動力學模擬的方法可以彌補上述不足。不僅如此,通過分子動力學模擬還能得到 蛋白質與DNA相互作用的具體過程(每個原子的運動軌跡)以及該過程中的許多重要的動力 學參數。自1977年McCammon J. A.等首次用分子動力學的方法研究蛋白質至今,分子動力學 模擬的計算方法迅速發展,模擬的體系從最初的數百個原子幾皮秒的尺度到今天260多萬個 原子幾百個納秒的尺度,模擬的對象包括蛋白質、DNA、 RNA等,應用範圍涉及製藥和生命 科學的眾多領域。但是,利用NAMD—2. 6計算軟體和VMD-1. 8. 6分析軟體通過對蛋白質與 DNA進行分子動力學模擬從而計算彼此之間相互作用力大小的方法,目前國內外未見報導。 發明內容針對現有技術的不足,本發明要解決的問題是提供一種利用NAMD一2. 6計算軟體和VMD-1. 8. 6分析軟體(http:〃www. ks. uiuc. edu/Research/namd/)通過模擬蛋白質與DNA的分子 動力學行為從而計算得到它們之間相互作用力大小的方法。本發明所述的方法,按如下步驟進行(1) 從PDB資料庫獲得含有由蛋白質和DNA所形成複合物的結構數據文件;(2) 利用VMD-1. 8.6軟體提取欲研究的目標蛋白質和DNA片斷,將其溶解到盛有 0.9。/。NaCl溶液的長方體水箱(Water Box)中,得到蛋白質-DNA-鹽溶液體系;所述體系中含 有非氫原子空間位置數據的結構,命名為ionized, pdb,含有氫原子以及氫鍵參數的結構, 命名為ionized, psf 5其中上述水箱內尺寸以蛋白質和DNA片斷距離水箱各壁的最小距離為12A,且蛋白質 沿DNA-蛋白質質心連線方向能移動不少於50A為準;(3) 利用NAMD—2.6軟體,採用Charmm27力場,用Ste印est Descent方法,在周期性 邊界條件(Periodic Boundary Conditions PBC)下對上述蛋白質-DNA-鹽溶液體系進行總時 間長度為100皮秒(ps)的能量最小化(Minimize)處理,在此過程中每1飛秒(fs)計算一次以
各原子為球心、半徑為IOA的球形空間內的其它原子對該原子的範德華力,每2飛秒(fs)計 算一次以各原子為球心、半徑為12A的球形空間內的其它原子對該原子的電場力;(4) 用20kcal/鵬l Y的和諧約束作用(Harmonic Constraint)約束蛋白質的a碳原子 (CA atoms),並用10kcal/mol A2的和諧約束作用約束DNA骨架原子(nucleic backbone atoms),採用與步驟(3)中相同的力場、周期性邊界條件、範德華力和電場力計算方法,並 且使用Langevin動力學(Langevin Dynamics)控溫方法禾口 Nose-Hoover Langevin piston 控壓方法將溫度控制在280K-320K,壓強控制在latm,對步驟(3)能量最小化處理後的體系 加熱100皮秒(ps),使體系逐漸升溫並穩定到280K-320K;(5) 對步驟(4)加熱後的體系,用lOkcal/mol A2的和諧約束作用約束蛋白質的a碳原 子,其它條件與步驟(4)相同,進行100皮秒(ps)的分子動力學模擬;(6) 去除對蛋白質的ci碳原子的約束,其它條件同步驟(4),對步驟(5)模擬後的體系進 行100皮秒(ps)的分子動力學模擬;(7) 用10kcal/mo1 〃的和諧約束作用約束DNA片段兩個末端各一個鹼基對的所有原 子,固定體系中所有的氫氧鍵長,將PME(Particle Mesh Ewald)格子邊長設置為1 ±0. 1A,採用與步驟(4)相同的力場、周期性邊界條件、範德華力和電場力計算方法、控溫控壓方 法、PME長程電場力計算方法,對步驟(6)模擬後的體系進行2-6納秒(ns)的分子動力學模 擬,使得體系的RMSD(Root Mean Square Distance)值達到水平;(8) 將步驟(7)模擬後體系中的DNA骨架原子固定,以蛋白質的d碳原子為 SMD(steered molecular dynamics)原子,將SMD係數(SMDk)設定為0.卜lkcal/mo1 42的任 意數值,SMD移動速度(SMDVel)設定為0. 0005 A/f s, SMD記錄頻率(SMD0utputFreq)設定為 100,其它條件與步驟(7)相同,對步驟(7)模擬後的體系進行100皮秒(ps)的SMD模擬,得 到該過程中各記錄點的熱力學參數,命名為smd. log;(9) 用VMD-1.8.6軟體處理文件smd. log,得到各記錄點的力,命名為ft.dat;(10) 以各記錄點的力為縱坐標、各記錄點的時刻為橫坐標作圖,得到將蛋白質從DNA 表面勻速拉開過程中力隨時間的變化曲線,曲線中縱坐標的峰值是蛋白質與DNA之間的最大 相互作用力。上述的利用計算機模擬蛋白質與DNA之間相互作用力的方法中步驟(4)中所述的溫度控制優選為310K;步驟(7)中所述的模擬時間優選為4納秒;步驟(8)中所述的SMD係數優選為0. 7kcal/mol A2。利用本發明所述的方法進行蛋白質與DNA之間相互作用力的計算與傳統實驗方法相比具 有明顯的優越性(1) 測定對象範圍廣泛,在資料庫中依靠非共價鍵相互作用結合形成的開放式蛋白質-DNA複合物之間的力都能測定;(2) 實驗材料易於製備,利用適當軟體對蛋白質-DNA複合物的晶體結構稍加處理即
可;(3) 設備要求低,在普通PC機或由普通PC機組成的機群(Cluster)上計算即可,不 需要購買原子力顯微鏡等大型設備;(4) 設備利用率高,在沒有幹擾的情況下CPU利用率可達到95n/。以上;(5) 便於在與分子識別和基因表達行為相關的生命科學和物理化學以及醫藥領域廣泛應用。
圖1 P01U結構域和與之相互作用的DNA片斷溶解在0. 9%NaCl溶液中。圖中P01JHD結構域和DNA片斷位於水箱的右側,左側有足夠的空間供SMD模擬中P0Uh。結 構域運動。其中A是POUHD結構域,B是與P01L結構域相互作用的DNA片斷。 圖2 SMD模擬後,POUHD結構域遠離DNA片斷。圖中P01L結構域沿DNA-POUHD質心連線方向運動到水箱左側,DNA位置不變。其中- A 是POUHD結構域,B是與P01V結構域相互作用的DNA片斷。 圖3 P01L結構域運動過程中受力的變化情況。在100ps時POUHD結構域受到的力最大,約為1542pN。
具體實施方式
下面結合實施例對本發明作進一步說明 實施例1:(1) 從PDB資料庫(http:// www. rcsb. org/pdb/home/home. do)獲得代碼為lo4x的複合物數據文件,命名為l04x.pdb;(2) 利用VMD-1.8.6軟體提取欲研究的目標蛋白質和DNA片斷,將其溶解到盛有0. 9%NaCl溶液的長方體水箱(84A*70A*6lA)中,得到蛋白質-DNA-鹽溶液體系(見圖1);所述 體系中含有非氫原子空間位置數據的結構,命名為lo4x—ionized, pdb,含有氫原子以及氫 鍵參數的結構,命名為lo4x_ionized. psf;(3) 利用NAMD_2. 6軟體,採用Char鵬27力場,用Ste印est Descent方法,在周期性 邊界條件(Periodic Boundary Conditions PBC)下對上述蛋白質-DNA-鹽溶液體系進行總時 間長度為100皮秒(ps)的能量最小化(Minimize)處理,在此過程中每1飛秒(fs)計算一次以 各原子為球心、半徑為IOA的球形空間內的其它原子對該原子的範德華力,每2飛秒(fs)計 算一次以各原子為球心、半徑為12A的球形空間內的其它原子對該原子的電場力;(4) 用20kcal/mol A'的和諧約束作用(Harmonic Constraint)約束蛋白質的a碳原子 (CA atoms),並用lOkcal/mol A2的和諧約束作用約束DNA骨架原子(nucleic backbone atoms),採用與步驟(3)中相同的力場、周期性邊界條件、範德華力和電場力計算方法,並 且使用Langevin動力學(Langevin Dynamics)控溫方法禾口 Nose-Hoover Langevin piston 控壓方法將溫度控制在310K,壓強控制在latm,對步驟(3)能量最小化處理後的體系加熱 100皮秒(ps),使體系逐漸升溫並穩定到310K; (5) 對步驟(4)加熱後的體系,用lOkcal/mol A2的和諧約束作用約束蛋白質的a碳原 子,其它條件與步驟(4)相同,進行100皮秒(ps)的分子動力學模擬;(6) 去除對蛋白質的a碳原子的約束,其它條件同步驟(4),對步驟(5)模擬後的體系進 行100皮秒(ps)的分子動力學模擬;(7) 用10kcal/mo1 ,A2的和諧約束作用約束DNA片段兩個末端各一個鹼基對的所有原 子,固定體系中所有的氫氧鍵長,將PME(Particle Mesh Ewald)格子邊長設置為1 ±0. 1A,採用與步驟(4)相同的力場、周期性邊界條件、範德華力和電場力計算方法、控溫控壓方 法、PME長程電場力計算方法,對步驟(6)模擬後的體系進行4納秒(ns)的分子動力學模 擬,使得體系的脂SD(Root Mean Square Distance)值達到水平;(8) 將步驟(7)模擬後體系中的DNA骨架原子固定,以蛋白質的a碳原子為SMD (steered molecular dynamics)原子,將SMD係數(SMDk)設定為0. 7kcal/mol 〃的任意 數值,SMD移動速度(SMDVel)設定為0. 0005 A/f s, SMD記錄頻率(SMD0utputFreq)設定為 100,其它條件與步驟(7)相同,對步驟(7)模擬後的體系進行100皮秒(ps)的SMD模擬(結果 見圖2),得到該過程中各記錄點的熱力學參數,命名為lo4x_smd.log;(9) 用VMD-1. 8. 6軟體處理文件lo4x—smd. log,得到各記錄點的力,命名為 1。4x一ft. dat;(10) 以各記錄點的力為縱坐標、各記錄點的時刻為橫坐標作圖,得到將蛋白質從DNA 表面勻速拉開過程中力隨時間的變化曲線(見圖3),曲線中縱坐標的峰值是蛋白質與DNA之 間的最大相互作用力,約為1542pN。實施例2:(1) 從PDB資料庫(http:〃www. rcsb. org/pdb/home/home. do)獲得代碼為lwtq的複合 物數據文件,命名為brtq.pdb;(2) 利用VMD-1.8.6軟體提取欲研究的目標蛋白質和DNA片斷,將其溶解到盛有 0.9。/。NaCl溶液的長方體水箱中,得到蛋白質-DNA-鹽溶液體系;所述體系中含有非氫原子空 間位置數據的結構,命名為lrtq—ionized, pdb,含有氫原子以及氫鍵參數的結構,命名為 lwtq—ionized, psf;(3) 利用畫D一2. 6軟體,採用Cha歷27力場,用Ste印est Descent方法,在周期性 邊界條件(Periodic Boundary Conditions PBC)下對上述蛋白質-DNA-鹽溶液體系進行總時 間長度為100皮秒(ps)的能量最小化(Minimize)處理,在此過程中每1飛秒(fs)計算一次以 各原子為球心、半徑為IOA的球形空間內的其它原子對該原子的範德華力,每2飛秒(fs)計 算一次以各原子為球心、半徑為12A的球形空間內的其它原子對該原子的電場力;(4) 用20kcal/mol V的和諧約束作用(Harmonic Constraint)約束蛋白質的a碳原子 (CA atoms),並用lOkcal/mol A2的和諧約束作用約束DNA骨架原子(nucleic backbone atoms),採用與步驟(3)中相同的力場、周期性邊界條件、範德華力和電場力計算方法,並 且使用Langevin雲力力學(Langevin Dynamics)控溫方法禾口 Nose-Hoover Langevin piston 控壓方法將溫度控制在280K,壓強控制在latm,對步驟(3)能量最小化處理後的體系加熱 100皮秒(ps),使體系逐漸升溫並穩定到280K;(5) 對步驟(4)加熱後的體系,用lOkcal/mol A2的和諧約束作用約束蛋白質的a碳原 子,其它條件與步驟(4)相同,進行100皮秒(ps)的分子動力學模擬;(6) 去除對蛋白質的a碳原子的約束,其它條件同步驟(4),對步驟(5)模擬後的體系進 行100皮秒(ps)的分子動力學模擬;(7) 用10kcal/rao1 A2的和諧約束作用約束DNA片段兩個末端各一個鹼基對的所有原 子,固定體系中所有的氫氧鍵長,將PME(Particle Mesh Ewald)格子邊長設置為1±0. 1A,採用與步驟(4)相同的力場、周期性邊界條件、範德華力和電場力計算方法、控溫控壓方 法、PME長程電場力計算方法,對步驟(6)模擬後的體系進行2納秒(ns)的分子動力學模 擬,使得體系的固SD(Root Mean Square Distance)值達到水平;(8) 將步驟(7)模擬後體系中的DNA骨架原子固定,以蛋白質的a碳原子為SMD (steered molecular dynamics)原子,將SMD係數(SMDk)設定為0. Ikcal/mol .人2的任意 數值,SMD移動速度(SMDVel)設定為0.0005 A/fs, SMD記錄頻率(SMD0utputFreq)設定為 100,其它條件與步驟(7)相同,對步驟(7)模擬後的體系進行100皮秒(ps)的SMD模擬,得 到該過程中各記錄點的熱力學參數,命名為lwtq—srad. log;(9) 用VMD-1.8.6軟體處理文件lwtq—smd.log,得到各記錄點的力,命名為 lwtq—ft. dat;(10) 以各記錄點的力為縱坐標、各記錄點的時刻為橫坐標作圖,得到將蛋白質從DNA 表面勻速拉開過程中力隨時間的變化曲線,曲線中縱坐標的峰值是蛋白質與DNA之間的最大 相互作用力。實施例3:(1) 從PDB資料庫(http:〃www. rcsb. org/pdb/home/home. do)獲得代碼為lhry的複合 物數據文件,命名為lhry.pdb;(2) 利用VMD-1.8.6軟體提取欲研究的目標蛋白質和DNA片斷,將其溶解到盛有 0.9。/。NaCl溶液的長方體水箱中,得到蛋白質-DNA-鹽溶液體系;所述體系中含有非氫原子空 間位置數據的結構,命名為lwtq—ionized, pdb,含有氫原子以及氫鍵參數的結構,命名為 lwtq一ionized. psf;(3) 利用NAMD—2. 6軟體,採用Charmm27力場,用Steepest Descent方法,在周期性 邊界條件(Periodic Boundary Conditions PBC)下對上述蛋白質-DNA-鹽溶液體系進行總時 間長度為lOO皮秒(ps)的能量最小化(Minimize)處理,在此過程中每1飛秒(fs)計算一次以 各原子為球心、半徑為IOA的球形空間內的其它原子對該原子的範德華力,每2飛秒(fs)計 算一次以各原子為球心、半徑為12A的 (4) 用20kcal/mol A^勺和諧約束作用(Harmonic Constraint)約束蛋白質的a碳原子 (CA atoms),並用lOkcal/mol A2的和諧約束作用約束DNA骨架原子(nucleic backbone atoms),採用與步驟(3)中相同的力場、周期性邊界條件、範德華力和電場力計算方法,並 且使用Langevin動力學(Langevin Dynamics)控溫方法禾口 Nose-Hoover Langevin piston 控壓方法將溫度控制在320K,壓強控制在latm,對步驟(3)能量最小化處理後的體系加熱 100皮秒(ps),使體系逐漸升溫並穩定到320K;(5) 對步驟(4)加熱後的體系,用lOkcal/mol A2的和諧約束作用約束蛋白質的a碳原 子,其它條件與步驟(4)相同,進行100皮秒(ps)的分子動力學模擬;(6) 去除對蛋白質的a碳原子的約束,其它條件同步驟(4),對步驟(5)模擬後的體系進 行100皮秒(ps)的分子動力學模擬;(7) 用10kcal/mo1 A2的和諧約束作用約束DNA片段兩個末端各一個鹼基對的所有原 子,固定體系中所有的氫氧鍵長,將PME(Particle Mesh Ewald)格子邊長設置為1±0. 1A,採用與步驟(4)相同的力場、周期性邊界條件、範德華力和電場力計算方法、控溫控壓方 法、PME長程電場力計算方法,對步驟(6)模擬後的體系進行6納秒(ns)的分子動力學模 擬,使得體系的RMSD(Root Mean Square Distance)值達到水平;(8) 將步驟(7)模擬後體系中的DNA骨架原子固定,以蛋白質的a碳原子為 SMD(steered molecular dynamics)原子,將SMD係數(SMDk)設定為lkcal/mol *入2的任意數 值,SMD移動速度(SMDVel)設定為0. 0005 A/f s, SMD記錄頻率(SMD0utputFreq)設定為100,其它條件與步驟(7)相同,對步驟(7)模擬後的體系進行100皮秒(ps)的SMD模擬,得 到該過程中各記錄點的熱力學參數,命名為lhry—smd. log;(9) 用VMD-1.8.6軟體處理文件lhry—smd. log,得到各記錄點的力,命名為 lhry—ft.dat;(10) 以各記錄點的力為縱坐標、各記錄點的時刻為橫坐標作圖,得到將蛋白質從DNA 表面勻速拉開過程中力隨時間的變化曲線,曲線中縱坐標的峰值是蛋白質與DNA之間的最大 相互作用力。
權利要求
1. 一種利用計算機模擬計算蛋白質與DNA之間相互作用力的方法,步驟是-(1) 從PDB資料庫獲得含有由蛋白質和DNA所形成複合物的結構數據文件;(2) 利用VMD-1.8.6軟體提取欲研究的目標蛋白質和DNA片斷,將其溶解到盛有 0.9%NaCl溶液的長方體水箱中,得到蛋白質-DNA-鹽溶液體系;所述體系中含有非氫原 子空間位置數據的結構,命名為ionized, pdb,含有氫原子以及氫鍵參數的結構,命名 為ionized, psf;其中上述水箱內尺寸以蛋白質和DNA片斷距離水箱各壁的最小距離為12A,且蛋 白質沿DNA-蛋白質質心連線方向能移動不少於50A為準;(3) 利用NAMD_2. 6軟體,採用Charmm27力場,用Ste印est Descent方法,在周 期性邊界條件下對上述蛋白質-DNA-鹽溶液體系進行總時間長度為100皮秒的能量最小 化處理,在此過程中每1飛秒計算一次以各原子為球心、半徑為10A的球形空間內的其 它原子對該原子的範德華力,每2飛秒計算一次以各原子為球心、半徑為12A的球形空 間內的其它原子對該原子的電場力;(4) 用20kcal/mo1 A2的和諧約束作用約束蛋白質的a碳原子,並用 lOkcal/mol A2的和諧約束作用約束DNA骨架原子,採用與步驟(3)中相同的力場、周 期性邊界條件、範德華力和電場力計算方法,並且使用Langevin動力學控溫方法和 Nose-Hoover Langevin piston控壓方法將溫度控制在280K-320K,壓強控制在latm, 對步驟(3)能量最小化處理後的體系加熱100皮秒,使體系逐漸升溫並穩定到 280K-320K;(5) 對步驟(4)加熱後的體系,用lOkcal/mol A2的和諧約束作用約束蛋白質的a 碳原子,其它條件與步驟(4)相同,進行100皮秒的分子動力學模擬;(6) 去除對蛋白質的a碳原子的約束,其它條件同步驟(4),對步驟(5)模擬後的體 系進行100皮秒的分子動力學模擬;(7) 用10kcal/mo1 A2的和諧約束作用約束DNA片段兩個末端各一個鹼基對的所有 原子,固定體系中所有的氫氧鍵長,將PME格子邊長設置為1±0. 1 A,採用與步驟(4) 相同的力場、周期性邊界條件、範德華力和電場力計算方法、控溫控壓方法、PME長程 電場力計算方法,對步驟(6)模擬後的體系進行2-6納秒的分子動力學模擬,使得體系 的服SD值達到水平;(8) 將步驟(7)模擬後體系中的DNA骨架原子固定,以蛋白質的a碳原子為SMD原 子,將SMD係數設定為O. l-lkcal/mo1 P的任意數值,SMD移動速度設定為0. 0005A/fs, SMD記錄頻率設定為100,其它條件與步驟(7)相同,對步驟(7)模擬後的體系進行100 皮秒的SMD模擬,得到該過程中各記錄點的熱力學參數,命名為smd. log;(9) 用VMD-1.8.6軟體處理文件smd. log,得到各記錄點的力,命名為ft.dat; (10)以各記錄點的力為縱坐標、各記錄點的時刻為橫坐標作圖,得到將蛋白質從 DNA表面勻速拉開過程中力隨時間的變化曲線,曲線中縱坐標的峰值是蛋白質與DNA之 間的最大相互作用力。
2. 如權利要求1所述的利用計算機模擬計算蛋白質與DNA之間相互作用力的方法, 其特徵是步驟(4)中所述的溫度為310K。
3. 如權利要求1所述的利用計算機模擬計算蛋白質與DNA之間相互作用力的方法, 其特徵是步驟(7)中所述的模擬時間為4納秒。
4. 如權利要求1所述的利用計算機模擬計算蛋白質與DNA之間相互作用力的方法, 其特徵是步驟(8)中所述的SMD係數是0. 7kcal/mo1 A2。
全文摘要
本發明公開了一種利用計算機模擬計算蛋白質與DNA之間相互作用力的方法。該方法利用NAMD_2.6計算軟體和VMD-1.8.6分析軟體進行分子動力學模擬,首先將PDB資料庫的蛋白質結構製成適當的研究體系,然後對該體系進行能量最小化處理,將體系加熱到設定溫度後,對體系進行多步平衡處理,接著對體系實施分子動力學模擬,然後標記體系中目標研究對象並對體系進行SMD模擬,最後處理和分析數據得到蛋白質與DNA之間的相互作用力變化情況,並求得它們之間的最大相互作用力。該方法測定對象範圍廣泛、實驗材料易於製備、設備要求低並且利用率高,便於在與分子識別和基因表達行為相關的生命科學和物理化學以及醫藥領域廣泛應用。
文檔編號G06F19/18GK101122933SQ20071011283
公開日2008年2月13日 申請日期2007年9月10日 優先權日2007年9月10日
發明者時永香, 步宇翔, 鵬 連 申請人:山東大學