分子表面隨機採樣分析法對抗愛滋病藥物活性的預測的製作方法
2023-06-13 05:21:06
分子表面隨機採樣分析法對抗愛滋病藥物活性的預測的製作方法
【專利摘要】分子表面隨機採樣分析法對抗愛滋病藥物活性的預測,搭建抗愛滋病藥物分子的二維與三維結構,得到分子中各個原子的Mulliken電荷布居數與笛卡爾坐標;生成分子的240個描述子,進行RASMS分析;進行逐步回歸變量篩選;在抗愛滋病藥物分子實測的實驗活性值與分子結構參數化計算值間進行數學建模;構建抗愛滋病藥物分子結構與性質/活性間關係的數學模型;在構建抗愛滋病藥物分子數學模型中獲得留一法交互檢驗復相關係數QCV;QCV值中選取最大復相關係數QCV;由對應最大復相關係數QCV的數學模型,確定最佳對藥物活性的預測模型,用於預測沒有經過實驗測定的同類型藥物的相關活性,具有計算過程簡單、構象重疊容易等優點。
【專利說明】 分子表面隨機採樣分析法對抗愛滋病藥物活性的預測
【技術領域】
[0001]本發明涉及計算機輔助藥物分子設計【技術領域】,特別涉及分子表面隨機採樣分析法對抗愛滋病藥物活性的預測。
【背景技術】
[0002]計算機輔助藥物分子設計(Computer-Aided Drug Design, CADD)是近年來在藥物開發領域一個非常活躍的研究方向,它涉及到分子圖形學、計算機科學、藥物化學、分子生物學等眾多學科,其宗旨是以計算機作為藥物設計的基本工具,結合相關專業知識對目標分子進行虛擬優化及篩選,以期達到最大限度提高合成藥物的有效命中概率從而降低藥物開發的成本及周期的目的。然而由於生物大分子三維結構測定困難使得基於配體分子結構與活性相關性研究即定量構效關係(Quantitative Structure-ActivityRelationship, QSAR)成為CADD的重要實現手段。60年代,由Hansch等提出了用於表達藥物活性與其理化性質關係的Hansch-Fujita分析法以及Free等所創立的具有指示變量性質的Free-Wilson法成為該領域的先驅,並被成功應用於如諾氟沙星、二氫葉酸還原酶抑制劑等藥物的設計當中。然而,由於該類方法都是建立在分子2D性質之上,難以很好表達藥物配基與受體之間的立體作用效果。和2D方法比較3D方法在物理化學意義上更為明確並能直接反映藥物分子作用過程中底物和受體之間的非鍵作用特徵,因此在近年來3D-QSAR方法得到了迅速的發展。其中主要以Cramer等創立的比較分子場法以及一系列與其類似的方法如比較分子相似性分析、比較分子瞬時偶極分析、GRID分析等基於分子空間勢場分布狀態分析方法成為當今3D藥物設計的主流。這一類方法最大的弊端是在進行一組分子構效研究時首先要對樣本進行空間構象疊合,另外在立體網格劃分、變量數目控制以及勢場探針選取等方面所面臨的問題同樣不容忽視。對於其它分子設計方法諸如Crippen創立的幾何距離法、Hopfinger等的分子形狀分析、Raevsky等發展的氫鍵熱力學、Jain 及 Walters 等基於虛擬受體提出的 COMPASS, GERM (Genetic Evolved Receptor Model)等也在不同程度上具有參數選取隨意、計算過程複雜、構象重疊困難等多方面缺點。
【發明內容】
[0003]為了克服上述現有技術的缺點,本發明的目的在於提供分子表面隨機採樣分析法對抗愛滋病藥物活性的預測,具有計算過程簡單、計算結果物理意義明確,可解釋性強的優點。
[0004]為了達到上述目的,本發明採取的技術方案為:
[0005]分子表面隨機採樣分析法對抗愛滋病藥物活性的預測,包括以下步驟:
[0006]①使用ChemofTice8.0自動搭建抗愛滋病藥物分子的二維與三維結構,使分子結構參數化,得到分子中各個原子的Mulliken電荷布居數與笛卡爾坐標;
[0007]②利用C語言自編程序Sampling-tool.EXE對藥物分子表面進行隨機採樣,每個分子得到240個描述子,然後進行RASMS分析;[0008]③通過SPSS for Windows 16.0統計學軟體包進行逐步回歸(SMR)變量篩選;
[0009]④在抗愛滋病藥物分子實測的實驗活性值與分子結構參數化計算值間依據多元線性回歸、偏最小二乘方法進行數學建模;
[0010]⑤構建抗愛滋病藥物分子結構與性質/活性間關係的數學模型;
[0011]⑥在構建抗愛滋病藥物分子數學模型中獲得留一法交互檢驗復相關係數Qw ;
[0012]⑦Qcv值中選取最大復相關係數Qw ;
[0013]⑧由對應最大復相關係數Qct的數學模型,確定最佳對藥物活性的預測模型,用於預測沒有經過實驗測定的同類型藥物的相關活性。
[0014]本發明的有益效果是:
[0015]本文提出了基於虛擬蛋白質原子探針的分子表面隨機採樣分析:分析目標定位於受體與藥物分子作用表面,避免了傳統3D勢場分析方法對分子內部與活性無關點的大量取樣而造成的系統噪音;通過分子表面大規模隨機採樣來全面獲取分子周圍勢場分布信息,從而避開了通常使用固定網格法劃分空間所帶來的問題,如分子疊合、網格大小選取等;該類方法是建立在分子3D性質之上,能很好表達藥物配基與受體之間的立體作用效果。和2D方法比較3D方法在物理化學意義上更為明確並能直接反映藥物分子作用過程中底物和受體之間的非鍵作用特徵,並成功應用於對部分抗愛滋病藥物的活性預測中。
【專利附圖】
【附圖說明】
[0016]圖1為DABO活性的模型計算值及實驗觀測值相關。
[0017]圖2為DAPY活性的模型計算值及實驗觀測值相關。
[0018]圖3為PETT活性的模型計算值及實驗觀測值相關。
【具體實施方式】
[0019]下面結合實例及附圖對本發明做詳細描述。
[0020]以下將分子表面隨機採樣分析方法分別對74個DABO類化合物、34個DAPY類化合物與61個PETT類化合物共3類有機物的結構進行表徵,使用Sampling-tool.EXE軟體,每個化合物可得到240個描述子,並與其相應的活性建立多元線性回歸模型,從而驗證分子表面隨機採樣分析方法在分子定量結構活性關係研究的有效性。
[0021 ] ①74個DABO類化合物的QSAR研究
[0022]選取15個化合物為測試集樣本(外部樣本),並以剩餘的59個作為訓練集樣本(內部樣本),使用Chemoffice8.0自動搭建74個DABO類抗愛滋病藥物分子的立體結構,用Chem3D自帶的MOPAC半經驗量子化學軟體在AMl水平上最終優化得到分子結構(截斷值
0.0OOlkJ/mol),並採用Mulliken布居分析法以單點形式計算出原子的淨電荷數量,將分子中每個原子的空間位置及電荷分別以笛卡兒坐標和淨電荷數目的形式輸入實驗室自編的C語言應用程式Sampling-tool.EXE加以處理,得到分子的240個描述子,計算得到192個非零矢量;繼而通過SPSS for Windows 16.0統計學軟體包對訓練集59個化合物的192個非零變量進行逐步回歸(SMR)變量篩選,SMR按Fisher顯著性檢驗依次引入變量,並採取有進有出的原則。另外,依據N/M3 3 (N為樣本容量,M為變量數)的經驗規則,結合交互校驗的復相關係數(Qct)變化情況,最終確定選用14變量回歸模型,模型的標準化形式如下:
[0023]pIC50=12.150+2.927*E卜3+2.322*Sh — 278.249?!, — 313.048*Ε2_1(ι+0.090*Η4_8+4.702*Η7_8 - 2.926*Η5_8+7.854^^+0.842*5^-0.596*S4_2+1.551^1 — 4.364*S8_3+7.923*S2_3+1.71側3_3
[0024]其中,E表不靜電作用;S表不立體作用;Η表不疏水作用,如,E1-表不第I類探針與第3類原子之間的靜電作用項,S3_8表示第3類探針與第8類原子之間的立體作用項,H7_8表示第7類探針與第8類原子之間的疏水作用項,以此類推。模型相關統計量為:樣本數(N)為59,復相關係數(R_),標準差(SD)與統計量(F)分別為0.923,0.357,18.138 ;留一法交互檢驗的復相關係數(QCT),標準差(SDw)和統計量(Fct)分別為0.869,0.460和9.677。進一步對模型外部15個化合物組成的測試集樣本預測診斷,計算出外部檢驗的復相關係數(Qrart)為0.793。樣本活性實驗觀測值與模型計算值相關情況見圖1。
[0025]②34個DAPY類化合物的QSAR研究
[0026]選取7個化合物為測試集樣本(外部樣本),並以剩餘的27個作為訓練集樣本(內部樣本),使用Chem0fTice8.0自動搭建34個DAPY類抗愛滋病藥物分子的立體結構,用Chem3D自帶的MOPAC半經驗量子化學軟體在AMl水平上最終優化得到分子結構(截斷值
0.0001kJ/mol),並採用Mulliken布居分析法以單點形式計算出原子的淨電荷數量,將分子中每個原子的空間位置及電荷分別以笛卡兒坐標和淨電荷數目的形式輸入實驗室自編的C語言應用程式Sampling-tool.EXE加以處理,得到分子的240個描述子,計算得到192個非零矢量;繼而通過SPSS for Windows 16.0統計學軟體包對訓練集27個化合物的192個非零變量進行逐步回歸(SMR)變量篩選,SMR按Fisher顯著性檢驗依次引入變量,並採取有進有出的原則。另外,依據·N/M3 3 (N為樣本容量,M為變量數)的經驗規則,結合交互校驗的復相關係數(Qct)變化情況,最終確定選用6變量回歸模型,模型的標準化形式如下:
[0027]pC=8.233 — 3793.239*Ε8_6+0.743*Η8_8_0.601^^ — 68.751*Ε6_6+22.750*Ε8_3+1.0
3佩_5
[0028]其中,E表示靜電作用;S表示立體作用;H表示疏水作用,如,E8_6表示第8類探針與第6類原子之間的靜電作用項,S1^3表示第I類探針與第3類原子之間的立體作用項,H8_8表示第8類探針與第8類原子之間的疏水作用項,以此類推。模型相關統計量為:樣本數(N)為27,復相關係數(R_),標準差(SD)與統計量(F)分別為0.953,0.132和32.841,留一法交互檢驗的復相關係數(Qw),標準差(SDct)與統計量(Fw)分別為0.849,0.231和
8.559。進一步對模型外部7個化合物組成的測試集樣本預測診斷,計算出外部檢驗的復相關係數(Qrart)為0.836。實驗值和預測值的相關性如圖2。
[0029]③61個PETT類化合物的QSAR研究
[0030]選取10個化合物為測試集樣本(外部樣本),並以剩餘的51個作為訓練集樣本(內部樣本),使用Chemoffice8.0自動搭建61個PETT類抗愛滋病藥物分子的立體結構,用Chem3D自帶的MOPAC半經驗量子化學軟體在AMl水平上最終優化得到分子結構(截斷值
0.0OOlkJ/mol),並採用Mulliken布居分析法以單點形式計算出原子的淨電荷數量,將分子中每個原子的空間位置及電荷分別以笛卡兒坐標和淨電荷數目的形式輸入實驗室自編的C語言應用程式Sampling-tool.EXE加以處理,得到分子的240個描述子,計算得到192個非零矢量;繼而通過SPSS for Windows 16.0統計學軟體包對訓練集51個化合物的192個非零變量進行逐步回歸(SMR)變量篩選,SMR按Fisher顯著性檢驗依次引入變量,並採取有進有出的原則。另外,依據N/M3 3 (N為樣本容量,M為變量數)的經驗規則,結合交互校驗的復相關係數(Qct)變化情況,最終確定選用11變量回歸模型,模型的標準化形式如下:
[0031]pIC50=2.380+3.153*Εη — 0.534*Η8_9 — 14.526*^_8 — 0.287^^+4.575*Η7_8+143.663*Η6_8+89.202*Η4_9 — 131.247*Ε7_9+148.779*Ε8_6+13.778*5^+9.373*?,
[0032]其中,E表不靜電作用;S表不立體作用;H表不疏水作用,如,E1-表不第I類探針與第3類原子之間的靜電作用項,S1,表示第I類探針與第10類原子之間的立體作用項,H8_9表示第8類探針與第9類原子之間的疏水作用項,以此類推。模型相關統計量為:樣本數(N)為51,復相關係數(Reum),標準差(SD)與統計量(F)分別為0.919,0.392和19.321,留一法交互檢驗的復相關係數(Qw),標準差(SDct)與統計量(Fw)分別為0.856,0.515和
9.713。進一步對模型外部10個化合物組成的測試集樣本預測診斷,計算出外部檢驗的復相關係數(Qrart)為0.885。實驗值和預測值的相關性如圖3。
[0033]以上所述,僅是本發明的較佳實施例而已,並非對本發明作任何形式上的限制,凡是依據本發明的技術實質對以上實施例所作的任何簡單修改、等同變化與修飾,均仍屬於本發明技術方案的範 圍內。
【權利要求】
1.分子表面隨機採樣分析法對抗愛滋病藥物活性的預測,其特徵在於,包括以下步驟: ①使用ChemofTice8.0自動搭建抗愛滋病藥物分子的二維與三維結構,使分子結構參數化,得到分子中各個原子的Mulliken電荷布居數與笛卡爾坐標; ②利用C語言自編程序Sampling-tool.EXE對藥物分子表面進行隨機採樣,每個分子得到240個描述子,然後進行RASMS分析; ③通過SPSSfor Windowsl6.0統計學軟體包進行逐步回歸(SMR)變量篩選; ④在抗愛滋病藥物分子實測的實驗活性值與分子結構參數化計算值間依據多元線性回歸、偏最小二乘方法進行數學建模; ⑤構建抗愛滋病藥物分子結構與性質/活性間關係的數學模型; ⑥在構建抗愛滋病藥物分子數學模型中獲得留一法交互檢驗復相關係數Qct; ⑦Qw值中選取最大復相關係數Qw; ⑧由對應最大復相關係數Qct的數學模型,確定最佳對藥物活性的預測模型,用於預測沒有經過實驗測定的同類型藥物的相關活性。
【文檔編號】G06F19/18GK103678951SQ201310675709
【公開日】2014年3月26日 申請日期:2013年12月11日 優先權日:2013年12月11日
【發明者】仝建波, 趙翔, 鍾黎, 周鵬, 程芳玲 申請人:陝西科技大學