一種基於分子結構和環境溫度預測化學物質與臭氧氧化反應速率常數的方法
2023-05-26 19:40:01 1
專利名稱:一種基於分子結構和環境溫度預測化學物質與臭氧氧化反應速率常數的方法
技術領域:
本發明涉及不同環境溫度下臭氧與有機化學物質氧化反應速率常數(k03)的快速預測方法,屬於面向環境風險評價的定量結構與活性關係OiSAR)技術領域。背景介紹大多數的工業化學品具有一定的生化穩定性,由光所引發的直接降解以及自由基反應是其在環境中轉化的主要途徑。在大氣層中有機汙染物的持久性(半衰期)可以通過與羥基自由基、硝基自由基和臭氧進行化學反應的速率常數等信息進行計算。大氣對流層中的有機汙染物,日間主要是通過羥基自由基和臭氧降解來去除,夜間主要是通過硝基自由基反應降解。其中,化合物與臭氧反應的降解速率常數(kj是表徵化學品在環境中持久性的關鍵參數。目前對於化學品環境持久性評價多基於實驗測試,如光解活性和活性氧物種 (ROS)氧化活性測試等,但完全依靠實驗測試來獲得化學品的環境持久性數據,具有巨大的財政壓力。同時,新合成的日常使用有機化學品正以每年500 1000種的速度增加,對這些化學品一一進行實驗測試,無法滿足環境管理的要求,亟需發展成本低且快速的化學品環境持久性評估方法。基於定量結構與活性關係OiSAR),可以從化學品的分子結構出發,預測化學品與臭氧反應的速率常數,彌補基礎數據的缺失,用於評估化學品的光穩定性。已報導關於的QSAR模型,但這些模型在實用性、預測能力與穩健性、應用域
Fatemi · (Fatemi, M. H. Prediction of ozone tropospheric degradation rate constant of organic compounds by using artificial neural networks. Analytica Chimica Acta. 2006,556 :355-363)建立了基於人工神經網絡 (ANN)的137種化合物與臭氧反應的QSAR模型,該模型採用非線性的方法,主要用於預測^SK條件下有機化合物與臭氧反應的1^,模型的透明度不強,不能預測不同溫度下的 k03。Pompe 禾口 Veber (Pompe,Μ.,Veber, Μ.,Prediction of rate constants for the reaction of O3 with different organic compounds. Atmospheric Environment. 2001, 35(22) :3781-3788)建立了基於多元線性回歸(MLR)的117種不同種類化合物與臭氧反應的QSAR模型,不能預測多個溫度下的kQ3。Jiang等(Jiang,J. L.,Yue, Χ. Α.,Chen, Q. F. Determination of ozonization reaction rate constants of aromatic pollutants and QSAR study. Bulletin of Environmental Contamination and Toxicology. 2010,85 568-72)建立了基於密度泛函理論(DFT)的39種芳香族化合物與臭氧反應的QSAR模型,該模型選擇的化合物種類單一,應用域偏小,需擴大應用域的範圍。構建實用性強且算法簡單透明的溫度依附性預測模型,並對其預測能力和穩健性進行評價,在此基礎上對應用域範圍進行表徵,對有機化學品的生態風險評價與監管工作具有重要意義
發明內容
本發明要解決的技術問題是提供一種不同環境溫度下有機化合物與臭氧反應速率常數的簡便、快速、低成本、應用範圍廣的預測方法。為解決以上技術問題本發明採用的技術方案如下(1)為了保證用於建立模型的數據準確性,對從文獻收集的實驗測定值進行評估和分析,刪除離群點。首先,對同一化合物的多個實驗測定值進行統計學評估,刪除偏離平均值的數據點;其次,對同一化合物在不同溫度下的Iogkffi對1/T作圖分析,刪除偏離線性的數據點。最終得到1 種有機化合物共264個Iogkffi數據,溫度範圍從178K到364K。根據化合物與臭氧反應的機理分析,計算26個量子化學描述符、1481個Dragon描述符和12 個分子結構碎片,加入1/T溫度描述符。化合物包括單烯烴、二烯烴及多烯烴、滷代烯烴、環狀化合物、芳香族化合物、含氧化合物、含氮化合物等。以4 1的比例隨機劃分訓練集和驗證集。(2)聯合應用逐步回歸和PLS回歸篩選訓練集的描述符組合,構建預測的QSAR 模型,具體步驟如下第一步,採用逐步回歸方法進行初篩變量,在多元線性回歸(MLR)模型中,膨脹因子(VIF)小於10 ;第二步,基於PLS回歸,篩選變量的過程如下先建立包含所有初篩得到的變量的 PLS模型,選擇模型相關係數的平方(R2)和累計交叉驗證係數(Q2oti)為參考值,R2和Q2am 是由Simca6. 0軟體計算得出;分別去除每個描述符一次,以R2和Q2aa數值升高最大的模型為基準模型,重複上述步驟直至R2和Q2oti不再升高為止。若有幾個方程的R2和Q2oti數值相近,則比較經自由度調整後的決定係數(R2adj),選擇R2adj最大的模型為最優模型。最優模型的表達式Iogk03 = -12. 542-493. 3X (1/T) +0. 41722XEHOMO+0. 4443Xelectrophility+O. 66 971Xnc = c-0. 26128XqCmax+0. 74783XBELm2+4. 8412XMor32v+0. 35198XH3u+0. 38372Xn =
CHE-1. 7438Xnffl^O. 4576Xn = CK2-1. 1235XnBM+0. 28542XnCIKCLE (1)其中,1/T表示溫度的倒數;Ehqmq表示最高佔據分子軌道能;electrophility表示親電性;η。=。表示碳碳雙鍵的個數;qCmax表示碳原子最大正電荷;BELm2表示BCUT描述符; Mor32v表示3D-Morse描述符;H!3u表示Getaway描述符;η = CHE表示=CHR的個數;nra2表示氨基的個數;H = Oi2表示=CR2的個數;nBM表示苯環上甲基的個數;如_表示脂肪環的個數。經內部驗證和外部驗證證實kQ3預測模型的穩健性和預測能力。模型的擬合能力由R2adj和均方根誤差(RMSE)來表徵,R2adj = 0. 849, RMSE = 0. 562,表明模型具有較好的擬合能力。穩健性用內部驗證的交叉驗證係數評價,交叉驗證係數Q2cum = 0. 838,表明該QSAR 模型具有較好的穩健性。模型的預測能力採用未參與建模的50個外部數據評價,由外部預測相關係數的平方(Q2rat)來表徵,Q2ext = 0.878,表明模型具有較好的預測能力。其中, R2adj, RMSE, Q2ext由下列公式得出
權利要求
1.一種基於分子結構和環境溫度預測化學物質與臭氧氧化反應速率常數的方法,其特徵在於,(1)首先,對同一化合物的多個實驗測定值進行統計學評估,刪除偏離平均值的數據點;其次,對同一化合物在不同溫度下的Iogkffi對1/T作圖分析,刪除偏離線性的數據點; 最終得到1 種有機化合物共264個Iogkra數據,溫度範圍從178K到364K ;根據化合物與臭氧反應的機理分析,計算26個量子化學描述符、1481個Dragon描述符和12個分子結構碎片,加入1/T溫度描述符;(2)聯合應用逐步回歸和PLS回歸篩選描述符組合,構建預測1 的QSAR模型;具體步驟如下第一步,採用逐步回歸方法進行初篩變量,在多元線性回歸(MLR)模型中,膨脹因子 (VIF)小於 10 ;第二步,基於PLS回歸,篩選變量的過程如下先建立包含所有初篩得到的變量的PLS 模型,選擇模型相關係數的平方(R2)和累計交叉驗證係數(Q2cJ為參考值,分別去除每個描述符一次,以R2和Q2cm數值升高最大的模型為基準模型,重複上述步驟直至R2y和Q2oti不再升高為止;若有幾個方程的R2和Q2cum數值相近,則比較訓練集的經自由度調整後的決定係數(R2atu),選擇R2atu最大的模型為最優模型;最優模型的表達式Iogk03 = -12. 542-493. 3X (1/T) +0. 41722XEHOMO+0. 4443Xelectrophility+O. 66971Xnc = G-0. 26128XqCmax+0. 74783XBELm2+4. 8412XMor32v+0. 35198XH3u+0. 38372Xn = CHE-1. 7438XnNH2+0. 4576Xn = CE2-l. 1235XnBM+0. 28542XnCIECLE (1)其中,1/T表示溫度的倒數;Ehqmq表示最高佔據分子軌道能;electrophility表示親電性;η。=。表示碳碳雙鍵的個數;qCmax表示碳原子最大正電荷;BELm2表示BCUT描述符; Mor32v表示3D-Morse描述符;H!3u表示Getaway描述符;η = CHE表示=CHR的個數;nra2表示氨基的個數;H = Oi2表示=CR2的個數;nBM表示苯環上甲基的個數;如_表示脂肪環的個數。
2.根據權利要求1所述的的方法,其特徵在於,所述的化合物包括單烯烴、二烯烴及多烯烴、商代烯烴、環狀化合物、芳香族化合物、含氧化合物、含氮化合物。
全文摘要
本發明公開了一種基於分子結構和環境溫度預測化學品與臭氧反應速率常數(kO3)的方法,屬面向化學品環境監管的定量結構-活性關係(QSAR)技術領域。kO3影響化學品在大氣中滯留時間(半衰期),是評估化學品的環境持久性的重要參數。本發明採用了量子化學描述符、Dragon計算的描述符、分子結構碎片表徵化合物的分子結構特徵,構建了預測kO3的QSAR模型。所構建的不同環境溫度下kO3的QSAR模型,經內部驗證和外部驗證證實了其有良好的穩健性和預測能力,並基於Williams圖法表徵了QSAR模型的應用域,明確了模型的應用範圍。
文檔編號G01N25/00GK102507630SQ201110392788
公開日2012年6月20日 申請日期2011年11月30日 優先權日2011年11月30日
發明者喬顯亮, 姜菁秋, 李晶, 李雪花, 蔡喜運, 趙文星, 陳景文 申請人:大連理工大學