新四季網

族性化學結構標引系統和標引方法

2023-04-24 18:57:36 2

專利名稱:族性化學結構標引系統和標引方法
技術領域:
本發明涉及一種化學結構尤其是族性化學結構的標引系統和標引方法,特 別涉及在建立化學結構尤其是族性化學結構資料庫時的標引系統和標引方法。
背景技術:
1924年,美國的Eugene Markush先生申請的一篇染料專利,被授予了美國 專利。Markush先生首先使用族性化學結構表達方法來代表具有相同母體結構但 取代基可變化的一組化合物,用以擴大其申報專利的保護範圍。此後,在化學 領域的專利文獻中常會看到包含有用Rn表示特性的族性化學結構,這種結構被 後人統稱為Markush結構。Markush結構的出現使得化學專利尤其是藥物專利的 成果保護上了一個新臺階。早在上世紀50年代,眾多科學家就開始對在計算機 上處理Markush結構展開了大量研究,但由於此類結構具有可變結構屬性,結構 表述本身具有歧義性,這給計算機處理帶來非常高的難度,因此真正實現商業 化應用的成果很少。直到目前,世界上也只有屈指可數的幾家公司,例如英國 德溫特公司(Derwent)、法國DARC公司和美國化學文摘社(CAS)等擁有對 Markush結構進行計算機檢索的實用技術,而且其技術處在嚴格保密之中。世界 著名化學信息處理公司MDL近年推出的ISIS系列產品,具有結構輸入功能,但 該系列產品是為了確定結構的輸入而設計的,並不適合表達複雜的族性化學結 構邏輯體系,標引人員用其勉強標弓l族性化學結構,發生輸入出錯率高,難以 糾錯,兼容性差和培訓困難等問題,且從資料庫讀回複雜的族性化學結構時, 圖像扭曲、失真嚴重,幾乎無法對錯誤的標引結果進行修改。
Markush結構的標引的基本原理是(1)首先分析專利例如藥物專利、化學 專利中的化學結構及其語言描述;(2)從中提取最主要的化學結構片段作為整 個Markush結構的骨架結構;(3)在骨架結構上用RGroup原子來代表一類可變 基團,其中RGroup原子稱為Rn原子,是由字母R與數字1到32組成的32個 特殊的原子符號之一,例如R1、R2、R19; (4)為每 一種RGroup定義取代基團, 同樣取代基團上可以繼續連接RGroup原子;(5)在每一個取代基團上設置連接
點,以標示出與骨架結構的連接位置;(6)定義RLogic,其中RLogic是由一個 或多個對RGroup進行限定的描述字符串組成的 一 組符號;(7 )把繪製的分子結
構以連接表的形式保存在存儲設備中。
為了解決上述難點,實現M紅kush結構的順利標引和檢索,需要提供一種適 合於複雜Markush結構的,能夠自動.糾錯的Marhish標引系統和標引方法,以適 應曰趨複雜的Markush結構的專利文獻與科技文獻的採集、管理、檢索與輸出, 提高標引輸入的結構適應性、標引的正確性、標引效率以及檢索的準確性。

發明內容
本發明旨在提供一種可對複雜的族性化學結構進行繪圖和對標引結果進行 計算機存儲、檢索處理,且操作方便、準確、易於糾錯的族性化學結構標引系 統和標引方法。
為了達到上述目的,本發明提供一種族性化學結構標引系統,該標引系統 通過包括輸入設備、顯示裝置、主存儲器、存儲設備、處理器和繪圖工具完成 Markiish結構數據的輸入、存儲、處理和輸出。
其中輸入設備用於以圖形形式輸入Markush結構信息。
其中顯示裝置用於顯示圖形用戶界面及輸入結構原始信息和轉換後信息的 可視化輸出。
其中主存儲器用於存儲執行中的電腦程式,以及繪製Markush結構時的實 時數據,數據以二進位序列化形式存於主存儲器中。
其中存儲設備用於存儲電腦程式文件,以連接表形式保存的Markush結構 的mol文件和wmdows位圖(微軟公司定義的一種圖形文件格式)圖形文件, 以及各種配置文件、臨時文件及歷史文件。
其中處理器是系統中主要的數據處理設備,用於分析輸入設備輸入的 Markush結構數據,並根據操作指令對Markush結構數據進行添加、刪除、修改
與轉換等處理。
其中繪圖工具包括一標引操作主模塊, 一結構格式處理主模塊, 一分子結 構顯示主模塊。
其中標引操作主模塊用於管理系統的用戶界面接口 ,並響應用戶的各種操 作。標引操作主模塊還包括一圖形用戶接口管理子模塊, 一族性結構標引子模
塊, 一模板管理子模塊, 一配置管理子模塊。其中圖形用戶接口管理子模塊用 於管理繪圖工具與用戶的交互界面,接收用戶的操作指令。其中族性結構標引 子模塊用於繪製分子骨架結構和取代基結構,形成族性結構,並對輸入的數據 進行實時分析,將分析結果轉換為結構顯示狀態,同時把圖形數據轉換為結構 數據保存到內存中。模板管理子模塊用於管理系統中常用的分子結構模板,包 括普通模板、鏈模板、環模板以及自定義模板,並允許通過直接定義或把存儲. 設備中的mol文件添加到模板庫中,同時允許對模板進行修改、刪除操作。配
置管理子模塊用於管理用戶對系統進行自定義設置的數據和文件,包括用戶對
輸出SDF文件的自定義信息,以及常用原子列表的自定義信息,系統允許通過 自定義數據編輯接口對自定義數據進行編輯修改。
族性結構標引子模塊還包括一確定結構標引子子模塊、一 Rn原子定義子子 模塊、 一連接點定義子子模快、一Rgro叩定義子子模快、一RLogic定義子子模 塊。其中確定結構標引子子模塊用於繪製確定的、無可變基團的分子結構。其 中Rn原子定義子子模塊用於在分子結構中定義一個能夠代表一類取代基的特殊 原子。其中連接點定義子子模塊用於為取代基團定義取代基與骨架結構的連接 位置。Rgroup定義子子模塊用於對取代基團進行分組設置。Rlogic定義子子模塊 用於對RGroup進行範圍限定。模板管理子模塊,用於管理分子結構模板,通過 模板管理操作窗口 ,用戶可以把當前繪製的分子結構或存儲器中的分子結構m o 1
文件添加到指定的模板中,添加後用戶可以直接在模板列表中調用分子結構模 板。
結構格式處理主模塊用於對輸入的分子結構數據進行數據格式處理及顯示 格式處理。結構格式處理主模塊還包括一結構圖形轉換子模塊, 一分子排列子 模塊, 一分子旋轉、放縮功能子模塊。其中結構圖形轉換子模塊提供一導出功 能,可以把當前繪製的分子結構轉換成wmdows位形數據。分子排列子模 塊提供縱向排列、橫向排列等功能,用戶在結構編輯窗口中先選中需要重新排 列的分子結構,然後點擊排列方式,分子結構圖形就會以指定的方式重新排列 放置。分子旋轉、放縮功能子模塊對選中的分子結構數據矩陣進行旋轉、放縮 計算,允許用戶通過滑鼠拖動來改變分子結構的顯示尺寸和方向,當用滑鼠點 住分子結構的右上角時滑鼠顯示為弧形箭頭,此時用滑鼠拖住光標進行旋轉, 分子結構就會作相應的旋轉。
分子結構顯示主模塊用於對圖面上的分子結構數據進行結構處理。分子結
構顯示主模塊還包括一錯誤顯示子模塊,一RGroup瀏覽子模塊,一 RGroup邏 輯樹子模塊, 一分子結構預覽子模塊。
其中錯誤顯示子模塊用於當繪製化學結構時出現價鍵錯誤的原子,或把未 設置取代點的分子添加到取代分子列表中,或把含有游離分子結構的族性結構 分子保存到文件中,或未定義Rn,以及族性結構中含有空RGi:oup諸情況時用 文字方式提示錯誤。
其中RGraiip瀏覽子模塊以表格的形式排列顯示所有的取代基團,每一行代 表一個RGroup所包含的取代基團分子結構,據此分辨各取代基團所屬的 RGroup 。
其中RGroup邏輯樹子模塊通過對當前繪圖區域中的所有分子進行遞歸處 理,把所有RGraup的關係通過樹狀形式清晰地顯示出來,通過觀察RGroup的
樹型關係圖,檢査族性結構的邏輯是否正確。
其中分子結構預覽子模塊可以使用戶在保存或打開文件前將繪製的化學結
構轉換為實際的規範化學結構供預覽,當存儲器中擁有大量的mol文件時,此
功能能夠有效提高用戶的操作效率和降低繪圖失誤率。
本發明還提供一種族性化學結構的標引方法,用於標引和繪製Markush結構 圖,對該類結構圖進行編輯、存取、格式處理、數據轉換、錯誤檢查和模板管 理。該方法包含以下步驟
(1)用戶在標引操作主模塊的Markush結構標引子模塊中,用輸入設備以 圖形形式輸入確定化學結構和Markush結構信息,包括輸入骨架結構信息和取代 基1"s息,
用輸入設備輸入Markush結構的步驟如下
(1) 在確定結構標引子模塊中輸入分子骨架結構; (n)在Rn原子定義子模塊中定義Rn原子;
(m)在確定結構標引子模塊中輸入取代基團;
(iv)在連接點定義子模塊中為所有取代基團定義連接點;
(V) 在RGroup定義子模塊中把取代基團添加到RGroup中;
(VI) 在RLogic定義子模塊中對所有RGi:oup邏輯結構進行定義。
(2) 系統主存儲器存儲輸入的信息,並通過結構圖形轉換子模塊將輸入的圖形信息轉換為分子結構數據;
(3) 模板管理子模塊調用結構模板,在結構模板的基礎上進行編輯,或將
當前結構繪製圖轉換成為模板;
(4) 結構圖形轉換子模塊將當前繪製的分子結構轉換成連接表數據或 Windows位形數據,,用於導出系統;
(5) 分子排列子模塊根據用戶在結構編輯窗口中選中需要重新排列的分子 結構及排列方式,以縱向或橫向方式重新排列分子結構;
(6) 分子放縮、旋轉功能子模塊根據用戶的指令,改變分子結構的顯示尺
寸和方向,或進行旋轉;
(7) 錯誤顯示子模塊分析輸入的族性化學結構和用戶的操作指令做出相應 的錯誤提示
I)當繪製的化學結構中出現了價鍵錯誤的原子,則系統用與該原子化學
結構圖顏色相異的色圈圈中該原子;
n)當用戶要把未設置取代點的分子添加到取代分子列表中時系統彈出對
話框提示錯誤設置;
m)當用戶要把含有游離分子結構的族性結構分子保存到文件中時,系統 會提示發現非法游離取代基團;
IV) 如果當前未定義Rn,此時往RGroup中添加取代基時系統提示未找到 對應的RGroup定義;
V) 如果族性分子結構中至少一個RGroup不含有任何分子結構,則在保存 時會提示發現空RGroup。
(8) RGmup瀏覽子模塊根據用戶指令,以表格形式排列顯示所有的取代 基團,每一行代表一個RGroup所包含的所有取代基,該模塊清楚地顯示所有取 代基的歸屬;
(9) RGroup邏輯樹子模塊通過對當前繪圖區域中的所有分子進行遞歸處 理,把所有RGronp的關係通過樹狀形式清晰地顯示出來,通過觀察RGraup的 樹型關係圖,檢查族性結構的邏輯是否正確,如果滿足如下條件即為正確
(I)無游離取代基團,即所有的取代基團都被添加到了 RGroup中; (II )無空RGroup,即所有的RGroup都包含有至少 一個取代基團; (m)取代基團上的連接點數量與RGroup原子的連接鍵數量相同。
利用本發明的系統和方法,可以方便地繪製、排列、存儲、編輯、檢索Markush 結構,並檢査繪圖中的Markush結構錯誤。


圖1是本發明專利族性化學結構的標引系統和標引方法的硬體架構圖。
圖2是本發明族性化學結構標引系統和標引方法的繪圖工具功能模塊圖。
圖3是本發明族性化學結構標引系統模塊界面圖。
圖4是本發明族性化學結構標引系統和標引方法的族性化學結構標引流程圖。
圖5是本發明族性化學結構標引系統和標引方法的結構預覽流程圖。
圖6是本發明族性化學結構標引系統和標引方法的模板管理子模塊使用流 程圖。
圖7是本發明族性化學結構標引系統和標引方法的結構圖形轉換子模塊使 用流程圖。
圖8是本發明族性化學結構標引系統和標引方法的RGroup樹分析流程圖。
圖9是本發明族性化學結構標引系統和標引方法的Markush結構輸入流程圖。
圖io是本發明族性化學結構標引系統和標引方法的分子排列示意圖。
圖11是本發明族性化學結構標引系統和標引方法的族性結構標引示意圖。
圖12是本發明族性化學結構標引系統和標引方法的RGroup樹示意圖。
具體實施例方式
第一實施例
圖l給出了本發明專利族性化學結構標引系統10和標引方法的硬體架構圖。 該系統架構包括一處理器12、 一主存儲器13、 一個或多個存儲設備14、 一顯示 裝置15, —輸入設備16。各硬體通過系統總線11相互連接,進行信息的傳遞。
處理器12是族性化學標引系統10進行數據處理的核心,負責處理、運算族 性化學結構標引系統10內部的所有數據。而總線11則負責族性化學結構標引系 統10內部所有數據的交換。主存儲器13用於存儲處於執行狀態的程序和數據。 存儲設備14用於存儲電腦程式以及計算機操作數據,其具體可以分為硬碟、軟盤、磁帶、光存儲設備以及其它數據存儲設備。顯示裝置5是向用戶展示計
算機操作結果的設備,而輸入設備16包含一鍵盤161及一滑鼠162,用於接收
用戶輸入信息,以控制計算機運行或為計算機提供操作原始數據。
電腦程式(又稱計算機控制邏輯)存儲於主存儲器13或存儲設備14中。 這些電腦程式所執行的功能是首先在處理器12控制下加載程序到主存儲器 中,然後以指令為單位,逐一傳送到處理器12中運行,控制族性化學結構標引 系統IO中各部分的協同作業。 '
圖2給出了本發明族性化學結構標引系統和標引方法的繪圖工具20的功能
模塊圖。
本發明所稱的模塊是指完成一特定功能的電腦程式段,用以描述一段特 定功能模塊的執行過程。該繪圖工具20包括一標引操作主模塊21, 一結構格式 處理主模塊22, 一分子結構顯示主模塊23。
其中標引操作主模塊21包含一圖形用戶接口管理子模塊211, 一族性結構 標引子模塊212, 一結構預覽子模塊213, 一模板管理子模塊214。
圖形用戶接口管理子模塊211用於管理與用戶交互的所有工具,包括菜單、 工具條以及窗口界面。
族性結構標引子模塊212用於標引族性化學結構,首先用戶通過輸入設備 16輸入化學結構,本模塊分析輸入設備發出的指令,根據指令要求在主存儲區 創建對應分子結構的矩陣數據,並對矩陣數據進行分析計算,最後根據指令把 主存儲區中的數據轉換成文本數據輸出到存儲設備M中。該模塊還包括將分子 結構及其相關數據轉換成SDF文件格式,以便用於操作大量的分子結構數據。 保存數據時,同時保存與標引分子結構相關的附屬信息,例如分子的編輯曰期 以及結構屬性數據。
配置管理子模塊213用於管理用戶對系統進行自定義設置的數據和文件。包 括用戶對輸出SDF文件的自定義信息,以及常用原子列表的自定義信息。系統
允許通過自定義數據編輯接口對自定義數據進行編輯修改。
模板管理子模塊214用於管理系統中常用的分子結構模板,包括普通模板、
鏈模板、環模板以及自定義模板,並允許通過直接定義的方式添加模板信息, 同時允許對模板進行修改和刪除操作。
結構格式處理子模塊22包含一結抅圖形轉換子模塊221,分子排列子模塊222,分子放縮、旋轉功能子模塊223。
結構圖形轉換子模塊221用於把用戶輸入的分子圖形轉換為主存儲器13中 的矩陣數據,或者把主存儲器13中的矩陣數據轉換為文本描述數據或Windows 位圖數據。
分子排列子模塊222用於根據用戶指令對分子結構進行排列,排列的基點 坐標按照每個分子的中心坐標計算,每個分子在排列後其中的原子相對於分子 的中心點坐標位置不變。
分子放縮、旋轉功能子模塊223用於計算並修改主存儲器13中的矩陣數據
來改變分子結構的顯示尺寸和方向,或進行旋轉。
其中分子結構顯示子模塊23包含一錯誤顯示子模塊231,一RGroup瀏覽子
模塊232, 一 RGroup邏輯樹子模塊233和一分子結構預覽子模塊234。
錯誤顯示子模塊231對出現錯誤的分子結構或原子進行提示出錯處理,其能 夠識別並做出相應處理的錯誤情況包括但不限於以下幾種
I)當繪製的化學結構中出現了價鍵錯誤的原子,則系統用與該原子化學 結構圖顏色相異的色圏圏中該原子;
n)當用戶要把未設置取代點的分子添加到取代分子列表中時系統彈出對 話框提示錯誤設置;
in)當用戶要把含有游離分子結構的族性結構分子保存到文件中時,系統 會提示發現非法游離取代基團;
IV) 如果當前未定義Rn,此時往RGroup中添加取代基時系統提示未找到 對應的RGroup定義;
V) 如果族性分子結構中至少一個RGroup不含有任何分子結構,則在保存 時會提示發現空RGroup。
RGroup瀏覽子模塊232用於以分組排列的單元格形式顯示所有取代基團, 由於每一行代表一個RGroup所包含的取代基團分子結構,根據此就能夠分辨出 各取代基團所屬的RGraup,在單元格中的分子基團如果其尺寸大於單元格的範 圍則隱藏超出單元格的部分。
RGraup邏輯樹子模塊233用於分析分子結構中各RGroup之間的關係,並 以倒樹結構顯示,其中RGroup原子名字做為樹的結點,樹的起始結點為骨架結 構上的RGroup原子。
分子結構預覽子模塊234用於在不打開mol文件時可以查看文件的內容,首 先結構圖形轉換子模塊221把文件內容轉換為矩陣數據存儲在主存儲器13中, 再由模塊234把分子結構的簡化圖形輸出到顯示裝置15中。
族性結構標引子模塊212包含一確定結構標引子子模塊2121, —Rn原子定 義子子模塊2122, —連接點定義子子模塊2123, 一 RGi:oup定義子子模塊2124, 一RLogk定義子子模塊2125。
其中確定結構標引子子模塊2121用於在繪圖區域中創建確定的、不含有可 變基團的分子結構。
其中Rn原子定義子子模塊2122用於在確定結構或取代基團上創建Rn原子。
其中連接點定義子子模塊2123用於在取代基團上創建兩個連接點以標示取
代基團與骨架結構相連接的位置。
其中RGroup定義子子模塊2124用於在主存儲區中創建可變基團的管理區 域,以管理取代基團,可以通過此模塊對取代基團進行添加、刪除、修改。
其中RLogic定義子子模塊2125用於對族性結構中的RGraup進行限定,限
定字符包含數字和比較操作符(<、〉、=)。
如圖3所示,是本發明族性化學結構標引系統模塊主界面圖310。該主界面 分割為多個區域,包括一菜單欄311, —系統工具欄312, 一RG1:cmp工具欄313, 一排列工具欄314,兩個模板工具欄即常用結構模板工具欄315和超原子工具欄 316, 一繪圖區317, 一繪圖工具欄318, 一 RGroup瀏覽區319, 一超原子工具 欄320。繪圖區317和RGroup瀏覽區319可分別擴大與縮小各自的尺寸。
其中菜單欄311包含打開、保存、列印、剪切、粘貼、撤銷、導入、導出、 選擇、清除、SDF設置、原子列表設置、自定義模板、定義RGroup原子、定義 RGraup、定義連接點和定義RGroup樹功能按鈕。
系統工具欄312包含新建、打開、保存、剪切、複製、粘貼和列印功能按鈕。
RGroup工具欄313包括定義RGroup、定義RLogic、定義連接點和定義 RGraup原子功能按鈕。
排列工具欄314包含對分子結構上對齊、下對齊、右居中、左對齊和上居中
功能按鈕。
模板工具欄包含常用結構模板工具欄315和超原子工具欄316功能按鈕。 繪圖區317是Markush結構圖的主繪製區,在該區域輸入各種化學結構及進行各類定義。
繪圖工具欄318包括矩形選擇工具、不規則選擇工具、橡皮、文本工具、單 鍵、雙鍵、三鍵、碳鏈工具、單鍵形楔出鍵、單鍵形楔入鍵、楔出鍵、楔入鍵、 未定義立體鍵、任意鍵和聚合物工具的功能按鈕。
RGroup瀏覽區319顯示RGroup名稱和RGroup所包含的取代基團列表,取 代基團以先後順序排列在RGroup名稱後面。如果取代基團較大無法完全顯示, 則超出單元格的部分被隱藏起來。
超原子工具欄320包含滷素、任意金屬、非氫原子、非C非H原子、錒系
原子、烷基/亞烷基(非環飽和烴基)、烯基/亞烯基(只含單鍵和雙鍵的非環 不飽和烴基)、炔基/亞炔基(至少含一個三鍵的非環不飽和烴基)、雜鏈烴基 /亞雜鏈烴基(非環烴基,含有雜原子取代非端點及連接點的碳原子)、芳基/ 亞芳基(含有芳香性基團的環烴基)、非芳香性環烴基/亞非芳香性環烴基、雜 芳基/亞雜芳基(含有芳香性基團的雜環基)、非芳香性雜環基/亞非芳香性雜 環基、聚合物的端基、染料殘基、螢光發色基團、聚合物或聚合肽的殘基、酸 官能團去掉羥基後得到的基團、保護基或官能阻斷基的功能按鈕。
如圖4所示,是本發明族性化學結構標引系統和標引方法的族性化學結構 標引流程圖。族性結構標引過程如下(1)新建一個繪圖窗口 (步驟411),用 於繪製建立化學結構標引圖;(2)在繪圖區域中繪製一個化合物骨架結構(步 驟412); (3)在繪圖區域中繪製取代基團(步驟413); (4)在取代基團上設置 連接點(步驟414); (5)分別把取代基團設置到對應的RGroup中(步驟41",
此時系統會判斷取代基團的連接點設置的是否正確,如果正確則繼續,否則重 新設置(步驟416); (6)設置RLogic (步驟""7); (7)將繪製的圖形轉換成連 接表文本數據並保存為Mol文件或SDF文件,或者將繪製的圖形轉換成Wmdows 位形數據並保存為位圖文件(步驟418); (8)判斷是否為合法的族性化學 結構,如果正確則繼續,否則重新修改結構(步驟419); (9)把Mol文件或SDF 文件或位圖文件輸出到存儲器中(步驟420)。
如圖5所示,是本發明族性化學結構標引系統和標引方法的結構預覽流程 圖。其過程如下(1)啟動預覽文件窗口,運行族性化學結構標引系統的主程 序(步驟51); (2)用輸入工具點擊文件打開按鈕,打開文件對話框,在文件對 話框中用輸入工具選擇要查看的mol文件(步驟52); (3) mol文件內容被載入到
主存儲裝置13中,在結構圖形轉換子模塊中mol文件內容被轉換成結構圖形矩陣
(步驟W); (4)轉換後的矩陣被輸出到顯示裝置15中(步驟54)。
如圖6所示,是本發明族性化學結構標引系統和標引方法的模板管理子模 塊使用流程圖。其過程如下(1)運行族性化學結構標引系統的主程序,在結 構標引子模塊21中繪斜確定分子結構(步驟61); (2)選中需要設置為模板的 分子結構(步驟62); (3)通過輸入工具執行"添加到模板"命令(步驟63);
(4)通過輸入工具為新模板命名(步驟64); (5)選擇目標模板庫(步驟6";
(6)執行添加命令(步驟66); (7)模板被添加到目標模板庫中(步驟67)。 如圖7所示,是本發明族性化學結構標引系統和標引方法的結構圖形轉換 子模塊使用流程圖。其過程如下(1)運行族性化學結構標引系統的主程序, 在結構標引模塊中繪製分子結構圖形(步驟71)或通過輸入設備16輸入mol文 件(步驟");(2)分子結構圖形被轉換為矩陣數據(步驟");(3)矩陣數據 被轉換為mol文件內容(步驟74)或被轉換為位圖文件(步驟"75); (4) mol文 件或位圖文件被輸出到存儲設備14中(步驟76)。
如圖8所示,是本發明族性化學結構標引系統和標引方法的RGraup樹分析 流程圖,其過程如下(1)運行族性化學結構標引系統的主程序,在結構標引 模塊21中繪製族性化學結構分子(步驟81); (2)執行"RGroupTree"命令, 遞歸遍歷所有Rgroup (步驟82); (3)分析分子結構中RGroup之間的邏輯關係
(步驟83); (4)建立以骨架結構上的RGroup為根結點的倒樹形結構結構樹(步 驟84); (5)把建立的倒樹形結構以圖形方式輸出到顯示裝置中(步驟85)。
如圖9所示,是本發明族性化學結構標引系統和標引方法的Markush結構輸 入流程圖,其過程如下(1)在確定結構標引子子模塊2121中輸入分子骨架結 構(步驟91);在Rn原子定義子子模塊2122中定義Rn原子(步驟9"; (3) 在確定結構標引子子模塊2121中輸入取代基團(步驟93); (4)在連接點定義 子子模塊2123中為所有取代基團定義連接點(步驟94); (5)在RGraup定義子 子模塊2〗24中把取代基團添加到RGroup中(步驟95); (6)在RLogic定義子 子模塊2125中對所有RGroup邏輯結構進行定義(步驟%)。
如圖IO所示,是本發明族性化學結構標引系統和標引方法的分子排列示意 圖,原始分子結構圖101經由分子排列子模塊222計算後橫向排列為分子結構圖 102,縱向排列為分子結構圖103。
如圖ll所示,是本發明族性化學結構標引系統和標引方法的族性結構標引
示意圖,通過族性化學結構標引系統標引一個族性分子結構的步驟如下
(1) 在確定結構標引子子模塊2121中繪製骨架結構in,並在Rn原子定義 子子模塊2122中定義R1原子,Rl原子為Rn原子中的一種;
(2) 在確定結構標引子子模塊2121中繪製取代基團112、取代基113和取 代基1H,並在Rn原子定義子子模塊2122中為取代基113定義R3原子和為取 代基114定義R2原子,R2和R3原子也都屬於Rn原子;
(3) 在連接點定義子子模塊2123中為取代基"2、取代基113和取代基114 定義連接點,即取代基上用紅色色圈圈著的位置,取代基上最多可以定義兩個 連接點,第二個連接點用藍圏表示;
(4) 在RGroup定義子子模塊2124中把取代基112、取代基113和取代基 114定義到Rl (圖1111)中;
(5) 重複步驟2到步驟4分別定義R2 (圖2222),其中包括取代基115和 取代基116,定義R3 (圖3333),其中包括取代基117,定義R4 (圖4444),其 中包括取代基118和取代基119, R4原子為Rn原子中的一種;
(6) 在RLogic定義子子模塊2125中定義RLogic結構1110,其中"R1>0" 表示Rl的數量不得少於1個,"R2〉0"表示R2的數量不得少於1個,"R3>0" 表示R3的數量不得少於1個,"R4>0"表示R4的數量不得少於1個,"RestH" 表示其RGroup原子可以為"H"原子。
如圖12所示,是本發明族性化學結構標引系統和標引方法的RGmup樹示 意圖。樹結構圖120是RGi:oup邏輯樹子模塊233對圖11中所示的標引結果做 出分析後,以樹型結構把所有RGroup的關係顯示出來。其中R1代表骨架結構 111上的Rl原子,Rl包含R2和R3, R2代表取代基114上的R2原子,R3代表 取代基"3上的R3原子,R2又包含R4,R4代表取代基115上的R4原子,RGroup 邏輯樹子模塊233以Rl為起始根結點進行遞歸遍歷所有RGrcmp生成樹型結構 圖Rl-R3和Rl-R2-R4。
第二實施例
下面描述的是第二實施例,其中與第一實施例功能相同的部分,在此不再 贅述。
如圖2給出的族性化學結構標引系統和標引方法的繪圖工具20的功能模塊 圖。
標引搡作主模塊21中的族性結構標引子模塊212用於標引族性化學結構, 首先用戶通過輸入設備16輸入化學結構,本模塊分析輸入設備發出的指令,根 據指令要求在主存儲區創建對應分子結構的矩陣數據,並對矩陣數據進行分析 計算,最後根據指令把主存儲區中的數據轉換成Windows位形數據輸出到 存儲設備"中。該模塊還包括將分子結構及其相關數據轉換成SDF文件格式,
以便用於操作大量的分子結構數據。保存數據時,同時保存與標引分子結構相 關的附屬信息,例如分子的編輯日期以及結構屬性數據。
標引操作主模塊21中的模板管理子模塊214用於管理系統中常用的分子結
構模板,包括普通模板、鏈模板、環模板以及自定義模板,並可以把存儲設備 中的mol文件添加到模板庫中,同時允許對模板進行修改和刪除操作。
以上描述的實施例僅僅是舉例或者說明性的描述,並非旨在是窮舉的或者 限制本發明,對於本領域普通技術人員來說,在本發明的精神和範圍內進行許 多修改、變化或替換是顯而易見的。選擇和描述的實施例僅僅是為了更好地解 釋本發明的原理。
權利要求
1.一種族性化學結構標引系統,包括輸入設備、顯示裝置、主存儲器、存儲設備、處理器和繪圖工具,用於完成Markush結構數據的輸入、存儲、處理和輸出,其特徵在於繪圖工具包括一標引操作主模塊,一結構格式處理主模塊,一分子結構顯示主模塊;標引操作主模塊用於管理系統的用戶界面接口,接收用戶由用戶界面輸入的各種繪圖操作指令,並將用戶繪製的分子骨架結構及取代基結構形成族性結構;結構格式處理主模塊用於實時的對用戶輸入的分子結構數據進行分析,並將分析結果轉換為計算機可識別的族性結構的mol文件和windows位圖(微軟公司定義的一種圖形文件格式)的圖形文件,同時把所述圖形文件保存到內存中;分子結構顯示主模塊用於對圖面上的分子結構數據進行結構處理,並通過用戶界面接口顯示結構信息;用戶由標引操作主模塊完成Markush結構數據的輸入,而結構格式處理主模塊對用戶輸入的Markush結構數據進行存儲和格式轉換,並通過分子結構顯示模塊顯示經過處理的、用戶可識別的結構信息。
2. 如權利要求l所述的一種族性化學結構標引系統,其特徵在於標引操 作主模塊包含一圖形用戶接口管理子模塊, 一族性結構標引子模塊, 一模板管 理子模塊,一配置管理子模塊;其中圖形用戶接口管理子模塊用於管理繪圖工具與用戶的交互界面,接收用戶的操作指令;其中族性化學結構標引子模塊用於繪製分子骨架結構和取代基結構,形成族性結構,並對輸入的數據進行實時 分析,將分析結果轉換為結構顯示狀態,同時把圖形數據轉換為結構數據保存到內存中;模板管理子模塊用於管理分子結構模板,通過模板管理操作窗口,把當前繪製的分子結構或存儲器中的分子結構mol文件添加到指定的模板中,添加後用戶可以直接在模板列表中調用分子結構模板;配置管理子模塊用於管理用戶對系統進行自定義設置的數據和文件,包括用戶對輸出SDF文件的自定義信息,以及常用原子列表的自定義信息。
3. 如權利要求l所述的一種族性化學結構標引系統,其特徵在於結構格 式處理主模塊包括一結構圖形轉換子模塊, 一分子排列子模塊, 一分子旋轉、 放縮功能子模塊;其中結構圖形轉換子模塊用於提供一導出功能,可以把當前繪製的分子結構轉換成windows位形數據;分子排列子模塊用於提供縱向排列、橫向排列功能;分子旋轉、放縮功能子模塊用於改變分子結構的顯示尺 寸和方向。
4. 如權利要求l所述的一種族性化學結構標引系統,其特徵在於分子結 構顯示主模塊還包括一錯誤顯示子模塊,一RGroup瀏覽子模塊,一RGroup邏 輯樹子模塊, 一分子結構預覽子模塊;錯誤顯示子模塊對出現錯誤的分子結構 或原子進行提示出錯處理,其能夠識別並做出相應處理的錯誤情況包括但不限 於以下幾種I)當繪製的化學結構中出現了價鍵錯誤的原子,則系統用與該原子化學 結構圖顏色相異的色圈圈中該原子;n)當用戶要把未設置取代點的分子添加到取代分子列表中時系統彈出對話框提示錯誤設置;m)當用戶要把含有游離分子結構,即包含已設置了連接點但未被添加到任何RGroup的取代基團的族性結構分子保存到文件中時,系統會提示發現非法游離取代基團;IV) 如果當前未定義Rn原子,此時往RGroup中添加取代基時系統提示未 找到對應的RGraup定義;V) 如果族性分子結構中至少一個RGixmp不含有任何分子結構,則在保存 時會提示發現空RGroup。
5. 如權利要求l所述的一種族性化學結構標引系統,其特徵在於族性化 學結構標引系統主界面分割的區域中同時包含繪圖區和瀏覽區,可分別擴大與縮小所述繪圖區和瀏覽區尺寸。
6. 如權利要求2所述的一種族性化學結構標引系統,其特徵在於族性結 構標引子模塊包含一確定結構標引子子模塊,一Rn原子定義子子模塊,連接點 定義子子模塊,一 RGmup定義子子模塊,一 RLogic定義子子模塊;其中確定 結構標引子子模塊用於繪製確定的、無可變基團的分子結構;其中Rn原子定義 子子模塊用於在分子結構中定義一個能夠代表一類取代基的特殊原子;其中連接點定義子子模塊用於為取代基團定義取代基與骨架結構的連接位置;Rgraup 定義子子模塊用於對取代基團進行分組設置;Riogic定義子子模塊用於對 RGroup進行範圍限定。
7. 如權利要求2所述的一種族性化學結構標引系統,其特徵在於分子結構子模板採用xml格式文件管理,xml文件中保存有分子結構和分子相關屬性信 白
8. 如權利要求3所述的一種族性化學結構標引系統,其特徵在於結構圖 形轉換子模塊將分子結構數據轉換為Windows位形格式文件。
9. 如權利要求3所述的一種族性化學結構標引系統,其特徵在於分子排 列子模塊將選中的標引化學結構按橫向或縱向的方式進行排序,每個分子的中 心坐標作為基準點坐標。
10. 如權利要求3所述的一種族性化學結構標引系統,其特徵在於分子旋轉、放縮功能子模塊對選中的分子結構數據矩陣進行旋轉、放縮計算。
11. 如權利要求4所述的一種族性化學結構標引系統,其特徵在於所述 Rn原子是由字母R與數字1到32組成的32個特殊的原子符號之一。
12. 如權利要求4所述的一種族性化學結構標引系統,其特徵在於RGroup 瀏覽子模塊以單元格的形式顯示取代基化學結構,由於每一行代表一個RGroup 所包含的取代基團分子結構,根據此就能夠分辨出各取代基團所屬的RGroup。
13. 如權利要求4所述的一種族性化學結構標引系統,其特徵在於RGroup 邏輯樹子模塊通過對當前繪圖區域中的所有分子進行遞歸處理,把所有RGroup 的關係通過樹狀形式清晰地顯示出來,通過觀察RGraup的樹型關係圖,能夠檢 査族性結構的邏輯是否正確,如果滿足如下條件即為正確無游離取代基團,即所有的取代基團都被添加到了 RGroup中; 無空RGroup,即所有的RGroup都包含有至少一個取代基團; 取代基團上的連接點數量與RGi:oup原子的連接鍵數量相同。
14. 一種族性化學結構標引方法,用於標引和繪製Mat:kush結構圖,對該類 結構圖進行編輯、存取、格式處理、數據轉換、錯誤檢查和摸板管理,其特徵 在於,包含以下步驟(1) 用輸入設備以圖形形式輸入確定化學結構和Markush結構信息,包括輸入骨架結構信息和取代基信息;(2) 系統主存儲器存儲輸入的信息,並通過結構圖形轉換子模塊將輸入的 圖形信息轉換為分子結構數據; (3) 模板管理子模塊調用結構模板,在結構模板的基礎上進行編輯,或將當前結構繪製圖轉換成為模板;(4) 結構圖形轉換子模塊將當前繪製的分子結構轉換成連接表數據或Windows位形數據,用於導出系統;(5) 分子排列子模塊根據在結構編輯窗口中選中需要重新排列的分子結構及排列方式,以縱向或橫向方式重新排列分子結構; .(6) 分子旋轉、放縮功能子模塊根據指令,改變分子結構的顯示尺寸和方 向,或進行旋轉;(7) 錯誤顯示子模塊分析輸入的化學結構和用戶的操作指令做出相應的錯誤提示。(8) RGroup瀏覽子模塊根據指令,以表格形式排列顯示所有的取代基團, 每一行代表一個RGroup所包含的所有取代基。(9) RGroup邏輯樹子模塊通過對當前繪圖區域中的所有分子進行遞歸處 理,把所有RGroup的關係通過樹狀形式顯示出來,通過RGroup樹型關係圖, 檢查族性結構的正確性。全文摘要
一種涉及在建立化學結構尤其是族性化學結構資料庫時的標引系統和標引方法,用於標引和繪製Markush結構圖,具有編輯、存取、格式處理、數據轉換、錯誤檢查和模板管理功能。該方法包括如下主要步驟(a)以圖形形式輸入確定化學結構和Markush的骨架結構信息和取代基信息;(b)將輸入的圖形信息轉換為分子結構數據;(c)將當前繪製的分子結構轉換成連接表數據或Windows位形數據;(d)以縱向或橫向方式重新排列分子結構;(e)對輸入的錯誤化學結構做出相應的錯誤提示;(f)以表格形式排列顯示所有的取代基團;(g)顯示RGroup樹型關係圖。上述能夠自動糾錯的Markush標引系統和標引方法提高了標引輸入的結構適應性、標引的正確性、標引效率以及檢索的準確性。
文檔編號G06F19/00GK101196963SQ20071030386
公開日2008年6月11日 申請日期2007年12月26日 優先權日2007年12月26日
發明者劉延淮, 峻 徐, 王新毅 申請人:北京時代楷模科技有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀