新四季網

用於自動提取系統建模元模型語言模型的方法和裝置的製作方法

2023-05-30 04:09:11 1

專利名稱:用於自動提取系統建模元模型語言模型的方法和裝置的製作方法
技術領域:
本發明涉及用於從系統的自然語言說明書中自動提取針對該系統的系統建模元 模型語言模型的方法、裝置和軟體。
背景技術:
在對諸如軟體系統的複雜系統進行工程化時,系統通常是通過自然語言功能說明 書來定義的。按照功能說明書來創建系統的一個重要前提是系統模型的產生。為了創建這 種模型,在將功能說明書轉換為給定建模規範語言或者元模型語言的系統模型之前,領域 專家必須首先對功能說明書進行解釋和概括。一旦已經創建了元模型語言模型,其可以被 進一步轉換為封裝由功能說明書所定義的概念和行為的模型。提供了用於根據功能說明書來創建模型的半自動系統,但是此類系統通常需要以 特定的標記語言來創建功能說明書。換言之,功能說明書必須包含用以指示目標模型元素 或者行為的顯式標記。在很多情況下,在每個階段使用人類代理人,每個代理人具有適當的不同的技能 集合。此外,功能說明書最初可能是針對由系統技術開發者的直接解釋而編寫的,而沒有提 供用於根據說明書本身來生成模型的機制。

發明內容
本發明的一個實施方式提供一種用於從系統的自然語言說明書中自動提取系統 的系統建模元模型語言模型的方法,該方法包括步驟a)從系統的自然語言說明書中提取句法結構,所述句法結構表示一個或多個句法 主語的集合;b)創建句法主語的預定集合與系統建模元模型語言的相應元模型元素之間的第 一映射;c)對於每個已識別的句法主語,按照所述映射來創建一個或多個元模型元素;以 及d)提供所創建的元模型結構元素,以便轉換為系統的模型。語句主語可以包括名詞短語,並且第一映射可以包括相應的名詞短語到相應的元 模型結構元素的映射。所述方法可以包括進一步的步驟e)提取表示與每個句法主語相對應的一個或多個句法謂語的集合的進一步句法 結構;f)創建句法謂語的預定集合與元模型元素的相應元模型關聯之間的第二映射; 以及g)按照已提取句法結構中識別的任何相應謂語,創建針對每個相應元模型結構元 素的一個或多個相應的元模型關係。如果謂語包括名詞短語,可以按照第一映射將相應的 名詞短語映射為進一步的元模型結構元素。元模型結構元素是元模型類。
所述方法包括進一步的步驟g)從自然語言說明書中提取一個或多個語義元素;以及h)如果與給定謂語相關聯的語義元素指示該謂語是被動式的,則將來自該謂語的 動詞短語映射為針對相應主語的元模型結構元素與針對該動詞短語的相應賓語的元模型 結構元素之間的元模型引用。如果語句謂語是主動式的,則可以將該主動式謂語的動詞短 語映射為針對與主語相對應的元模型結構元素的元模型操作。語義元素的集合可以包括與 一個或多個主語或者賓語相關聯的可選語義元素的集合,其可被映射為相應元模型結構元 素的一個或多個屬性。可以根據可選語義元素來確定用以識別共同語義主題的主題聚類數據,並將其轉 譯為相應的元模型元素,從而支持系統模型中的共同語義主題的標識。可以將與每個句法 結構元素或者關係相關聯的表面結構元素轉譯為針對相應元模型元素或者關係的標籤。語 義元素的提取可以包括用於求解語義同義詞的可變性校平(levelling)過程。可以使用統 一建模語言(UML)來創建模型。元模型語言是Ecore 。系統的自然語言說明書可以是高 層功能說明書(HLFS)。 另一實施方式提供一種用於從系統的自然語言說明書中自動提取系統的系統建 模元模型語言模型的裝置,所述裝置可操作以從系統的自然語言說明書中提取句法結構,所述句法結構表示一個或多個句法主 語的集合;創建句法主語的預定集合與系統建模元模型語言的相應元模型元素之間的第一 映射;對於每個已識別的句法主語,按照所述映射來創建一個或多個元模型元素;以及提供所創建的元模型結構元素,以便轉換為系統的模型。又一實施方式提供一種可載入數字計算機內部存儲器的電腦程式產品,其包 括軟體代碼部分,當所述產品在計算機上運行時,所述軟體代碼部分用於執行一種用於從 系統的自然語言說明書中自動提取系統的系統建模元模型語言模型的方法,該方法包括步 驟a)從系統的自然語言說明書中提取句法結構,所述句法結構表示一個或多個句法 主語的集合;b)創建句法主語的預定集合與系統建模元模型語言的相應元模型元素之間的第 一映射;c)對於每個已識別的句法主語,按照所述映射來創建一個或多個元模型元素;以 及d)提供所創建的元模型結構元素,以便轉換為系統的模型。另一實施方式提供一種可載入數字計算機內部存儲器的電腦程式產品,其包括 軟體代碼部分,當所述產品在計算機上運行時,所述軟體代碼部分用於提供一種用於從系 統的自然語言說明書中自動提取系統的系統建模元模型語言模型的裝置,所述裝置可操作 以從系統的自然語言說明書中提取句法結構,所述句法結構表示一個或多個句法主 語的集合;
創建句法主語的預定集合與系統建模元模型語言的相應元模型元素之間的第一 映射;對於每個已識別的句法主語,按照所述映射來創建一個或多個元模型元素;以及提供所創建的元模型結構元素,以便轉換為系統的模型。


現在將僅通過示例的方式參考附圖來描述本發明的實施方式,其中圖1是提供由建模應用程式提供的建模系統的計算機系統的示意圖;圖2是圖1的建模應用程式的部件的示意圖;圖3是圖2的建模應用程式的自然語言處理模塊的示意圖;圖4是用於由圖2的建模應用程式來處理的自然語言功能說明書的示例;圖5是由圖3的自然語言處理模塊針對圖4的功能說明書的第一語句而從圖4的 自然語言功能說明書中提取的本體;圖6是圖2的建模應用程式中使用的映射表;圖7是按照圖4的映射表根據圖5的本體而創建的元模型語言模型;圖8是根據圖7的元模型語言模型而創建的UML模型;圖9是示出在提取圖5的本體時由圖3的自然語言處理模塊執行的處理的流程 圖;以及圖10是示出在根據圖5的本地來創建元模型語言模型時由建模應用程式執行的 處理的流程圖。
具體實施例方式參考圖1,計算機系統101包括具有作業系統103的計算機102。作業系統103為 形式上為建模應用程式104的應用程式提供平臺。建模應用程式104被布置為輸入系統的 自然語言說明書,例如功能說明書(FS) 105,並且以統一建模語言(UML)模型106的形式創 建FS105中所描述系統的概念模型。參考圖2,建模應用程式包括三個主要部件,其形式為自然語言處理(NLP)模塊 201、映射模塊202和模型創建模塊203。自然語言處理(NLP)模塊201布置用於輸入自然 語言FS 105並從FS 105中提取句法和語義數據,以及輸出形式上為FS 105的本體204的 提取數據。由NLP模塊201執行的處理將在下文進一步詳細描述。本體204被輸入到映射 模塊202,其將本體204的元素映射為用於輸出UML模型106的元模型語言。在本實施方式 中,元模型語言是Ecore ,其是加拿大安大略省渥太華市Centr印ointe Drive路102號的 Eclipse Foundation公司提供的Eclipse 平臺的一部分。由映射模塊202執行的映射是 按照映射表205執行的,該映射表205提供本體204的句法和語義元素的預定集合與元模 型語言中的結構元素和關係之間的映射。映射模塊202的輸出是以元模型語言(MML)定義 的、來自FS 105的概念的模型206。MML模型206是模型創建模塊203的輸入,其中MML模 型206在模型創建模塊203處被轉換為來自FS 105的功能概念的UML模型。UML模型106 繼而可以用於對由FS 105定義的系統進行人工或者自動創建。例如,如果FS 105描述了 一個軟體系統,UML模型可以用於所定義軟體系統的自動化產生。
參考圖3,在本實施方式中,NLP模塊201包括文本規格化模塊301、初級語義解析 器302、結構解析器303、次級語義解析器304以及主題聚類模塊305。這些模塊301、302、 303,304和305 —起工作,從FS 105中提取本體204的相應方面。文本規格化模塊301布 置用於從FS 105消除文字影響(諸如大小寫、粗體或者斜體)以及擴展簡寫和縮寫,從而 將FS 105轉換為純文本306。文本規格化301按照規則集307來執行該轉換,其中規則集 307定義了需要識別的文字影響以及用於將此類特徵轉換為純文本的過程。繼而將純文本FS 105輸入初級語義解析器302,其使用詞典308以語義限定詞或 屬性的形式來識別每個詞語的相關語義。利用包括相關的已識別語義限定詞和屬性的一個 或多個標記,對純文本FS 105中的每個詞語進行增強。詞典308包含與所有詞語類型(諸 如,名詞、動詞、形容詞、副詞)的語義解釋有關的信息。例如,詞典308布置用於在以動作 和結果的形式隱含某種活動的動詞與指示狀態和所有權的動詞之間進行區分。由此,語義 解析器302布置用於識別動態動詞(或稱為有效動詞),並且將其與狀態動詞區分開。換言 之,對諸如「將要」、「包括」、「涉及」、「隱含」等被認為是與相應名詞相關聯的屬性的限定動 詞與諸如「發送」、「接收」、「修改」等可能影響其他概念的其他動詞區分開。例如,給出兩個 短語"The first component comprises four features (牛舌四f 牛寺ffi ),,"The first component will contact the database (第一部件將聯繫資料庫)」動詞「包括」表示包含關係,而「聯繫」表示操作或者活動。由此,初級語義解析器 302的輸出309是純文本FS 105,其中每個單詞標記有其按照詞典308的含義。繼而將經 過語義標記的純文本FS 309輸入結構解析器303。結構解析器303布置用於關於語法規則集所定義的語法310來分析其輸入的句法 結構和關係。由此,結構解析器303識別每個詞語的句法功能,以及可能存在於給定詞語和 短語之間的句法關係和關聯。例如,語法310提供用於分析動作的規則,從而識別動作的發 起者和接受者以及動作的任何預期目標或者結果。在FS 105中給定以下短語"The process involves three components (過程涉及三個部件)」語法規則布置 用於識別如下句法結構,在大括號中示出{定冠詞} the{名詞} {主語}process{動詞} {第三人稱單數} involves{數量限定詞} {基數} three{名詞} {賓語} components例如,語法規則識別諸如名詞短語或者動詞短語連同成分等句法結構,以及諸如 名詞、動詞和動詞或限定詞的主語和賓語等其他句法元素。在本實施方式中,句法分析還將 給定語句的句法元素劃分為主題和相關注釋。主題通常等同於語句或者句法主語,而註解 等同於語句或者句法謂語,如在上面的示例中,其將是主題{定冠詞} the{名詞} {主語}process註解
8
{動詞} {第三人稱單數} involves{數量限定詞} {基數} three{名詞} {賓語} components
在其他示例中,主題可以等同於語句謂語,而註解等同於其主語。而且,語法規則識別元素之間的各類關聯,諸如包含、概括或者需要關係。包含關 系表示一個實體包括一個或多個其他實體。概括關係表示給定的實體是具有共同屬性的實 體群組的一個示例。需要關係表示一個實體是另一實體的所需部分。通過上面的示例,語 法規則將識別三個部件與過程具有包含關係,反之,這些部件與過程具有需要關係。這些 關係可以表示如下component {包含} process ;process {需要} component如上所述,語法規則還布置用於識別給定動作的發起者和接受者以及此類動作的 任何目的。在FS 105中給出以下短語「The first component must send requests to the second for monitoringdata.(第一部件必須向第二部件發送針對監測數據的請求)」語法規則布置用 於識別第一部件(部件1)向第二部件(部件2)發起具有參數(監測數據)的動作(發 送請求)。這識別了兩個部件以及監測數據之間的關係,並且識別了兩個部件之間涉及監測 數據對象的動作。該語法關係可以表示如下Send request {發起者} component 1 ;Send request {巨白勺} monitoring data ;Send request {接受者} component2.由此,結構解析器303的輸出311包括FS 105內容的表示以及由適當標籤所識別 的句法結構、元素和關係。來自結構解析器303的輸出311被輸入次級語義解析器304。次級語義解析器304 布置用於按照規則集312來識別復指引用並且繼而執行直指擴展,以求解間接的、非解釋 性引用。例如,描述性和聲明性文本通常使用諸如代詞或者限定詞等句法機制來避免重複, 如以下示例中"The process involves three components. It uses these to check integrity. Each of them in turn comprises four sub-components.(過禾呈涉及三個部 件。它使用這些來檢查完整性。它們中的每一個繼而包括四個子部件)」次級語義解析器304布置用於識別代詞「它」、「這些」和「它們」的使用,並且將其 求解或者擴展為其相應的適當名詞短語。在上面示例中,按照適當的規則312,「它」求解為 「過程」,而「這些」和「它們」求解為「三個部件」。次級語義解析器304進一步布置用於執行超出語言處理中通常完成的子過程。自 然語言通常使用完全或者部分的同義詞,其中,出於風格上的原因,可以使用多個不同的名 詞短語來指代共同的或者部分共同的對象。換言之,使用的不同詞彙項導致了含義上部分 或者完全的重疊。可變性校平是用於求解此類同義詞的過程。考慮下文「There are three components for software,hardware,and interfacemanagement. These modules fulfill the following functions (存在三個部件用於軟體、硬體和接口管理。這些模塊履行以下功能)」術語「部件」、「軟體(管理)」、「硬體(管理)」、「接口(管理)」以及「模塊」指代 相同的概念。而且,「部件」與「軟體」、「硬體」與「接口管理」之間的關係是清楚的。然而, 最初並不清楚這些部件是否是部件的子類型,或者其是否是系統本身的部件。由次級語義 解析器304所執行的可變性較平過程布置用於參考整體FS 105來求解這種模糊性。次級 語義解析器304最初保持所有名詞短語(部件、軟體管理、硬體管理和接口管理)。在文檔 的結尾,如果「部件」沒有與其他概念相關聯,則其被標註為可能刪除。繼而處理其餘名詞短 語(軟體管理、硬體管理和接口管理),以確定其是否共享任何關聯的項,諸如其包含的特 徵或者其執行的操作。如果他們共享任何此類特徵或者操作,則將其與上位項「部件」相關 聯,並且標記為該上位項的子類型。否則,移除已經被標註為抑制的上位項「部件」。由此, 次級語義解析器304的輸出313包括利用可變性較平得到的經擴展的復指引用和直指引用 以及經求解的同義詞。NLP模塊201的最終階段是主題聚類模塊305,其布置用於取得先前階段的累積輸 出。使用由初級語義解析器302添加的語義標記,按照本體204來識別共同語義主題,並且 利用主題標識符對其加標記,從而區分每個此類已識別群組。按照規則集314來執行主題 聚類。主題聚類模塊305的輸出是與本體的項相關聯的一組標記,其唯一地識別對於每個 已識別主題來說共同的項。 圖4示出了適於向NLP模塊201輸入的用於計算計劃預訂系統的示例功能說明書 105的前三段。圖5示出了針對圖4中以粗體示出的FS 105的第一段而提取的本體204。 本體204包括一組層級式布置的句法元素,每個句法元素被封閉在句法開始和結束標籤之 間,其中句法開始標籤和句法結束標籤的形式分別是尖括號中封閉的syntacticlabel (句 法標籤)(〈syntactic label 和在尖括號中封閉之前具有斜線的syntactic label (</ syntactic label 。層級主要被劃分為主題和評註部分,其例如可以等同於語句主語和謂 語。在每個主要劃分內,諸如名詞短語、動詞短語、介詞短語等句法元素及其相應的句法成 分可以按照語法310來層級式地布置,並且相應地標記。表面結構(也即,來自FS 105的 詞語本身)通過鄰近其相應句法標記的粗體類型來表示。在適用的情況下,由初級語義解 析器302按照詞典308插入的語義標籤跟隨在相應的表面結構之後,並且利用大括號({}) 來表示。在圖5中,名詞成分與屬性(也即,相關的項或者特性)相關聯。在編程項中,這 些等同於函數或者方法調用的參數。在文本分析中,這些是共同用來描述或者擴展功能說 明書中的其他語句中或者詞典308中提供的語義定義中的主題名詞本身的那些名詞。對於 圖5的本體,按照針對標記語言的共同實踐,在名詞標籤內列出屬性。如上所述,映射模塊202布置用於按照映射表205將來自所提取本體204的元素 映射至MML模型206。圖6示出了映射表205的一個示例,其在本實施方式中布置用於將來 自本體204的英文自然語言元素映射至Ecore 概念形式的元模型語言(MML)。將每一個 識別的名詞或者名詞短語映射為EClass (E類),其等同於UML類。將針對給定名詞或者名 詞短語的任何語義限定詞、特徵或者補語添加到適當的EClass作為EAttribute (E屬性), 其等同於UML屬性。將每個識別的動詞或者動詞短語(其還在其關聯語義中被定位為被動 式)映射為針對句法中定義的動詞的主語和賓語而創建的相關類之間的EReference (E引 用)。類似地,添加語義標記所識別的包含、需要和概括({Is_Type})關係作為相關EClass 之間的EReference。繼續上面的包含/需要示例,兩個相關的名詞如下映射為EClass
EClass :process (過程)EClass component (部件)繼而將包含/需要關係如下映射作為這兩個EClass之間的EReference EClass :processEReference :type component iscontainment = yesEClass componentEReference :type component iscontainment = no 其中動詞或者動詞短語在其相關聯的語義中被作為主動式和有效的,繼而其被映射為針對相關EClass的 EOperation(E操作)。表面結構(也即,實際FS 105的詞語)被用作針對相關ECore 結 構的EName (E名稱)。總之,在本實施方式中,名詞短語被映射為EClass,不及物/被動式 動詞短語被映射為EReference,而產生結果(效果)的及物動詞被映射為針對語義上被識 別為動作發起者的EClass的EOperation。將包含、需要和概括關係映射為適當的方向性 EReference,方向性通過相關聯的語義來確定。圖7示出了針對圖4的整個示例FS 105而創建的MML模型206,其描述了所創建 的Ecore 結構。可以人工處理MML模型,以產生UML模型圖。在本實施方式中,將MML模型 206傳遞至模型創建模塊203,以便自動轉換為UML模型106。圖8示出了根據圖7的MML模 型206而針對FS 105產生的UML模型106。UML模型包括根據名詞短語「booking (system) (預訂(系統))」而創建的第一類801,以及根據名詞短語「order entry (訂單輸入)」而創 建的第二類802。類801與802之間的關係803包括從動詞短語「is accessecK被訪問)」 得到的關聯。每個類801和802被填入來自其在本體204中的相應名詞短語的相關屬性。由 此,前兩個類801、802及其關係從FS 105的第一語句導出,並且其對應於圖5的已提取本 體204。對FS 105的其餘語句的分析產生三個進一步的類,其形式為^Passenger (旅客)」 類 804,"Individual (個人)」類 805 以及「Party (團體)」類 806。「Passenger」類 804 與 「Booking」類 801 相關聯。「Individual」類 805 和「Party」類 806 被識別為對「Passenger」 類804的概括。每個類801、802、804、805和806包括多個屬性807。而且,「Booking」類 801和「Passenger」類804每個都包括相應的操作809和810。例如,從圖4中所示的FS 105的第二段的第二語句中的相應及物動詞導出「cancel (取消)」和「COnfirm(確認)」操 作 808。現在將參考圖9的流程圖進一步描述NLP模塊201所執行的處理。響應於建模應 用程序104的啟動,處理開始於步驟901,繼而處理移至步驟902。在步驟902處,輸入FS 105,並且處理移至步驟903。在步驟903處,如上所述規格化FS 105的文本,並且處理移至 步驟904。在步驟904處,按照詞典308來執行對FS 105的初級語義解析,以添加相關的語 義標記。針對FS 105的第一句的該處理步驟如下The//+{DEFINITE}+{UNKNOWN ANTECEDENT}booking system//+{ADMIN}+{AUTOMATION}+{SALES}is//+{TO BE}+{PASSIVE}accessed//+{ENTRY}+{RECIPIENT}via//{MEANS}+{OBJECT}the//{DEFINITE}+{UNKNOWN ANTECEDENT}
order//{SALES}+{RECORD}entry//{ENTRY}+{RECIPIENT}application//{MEANS}+{AGENT}處理繼而從步驟904移至步驟905,在此按照語法310來執行結構解析,從而為FS 105的詞典項目加標記,並且識別任何內部關聯,如下所示TOPIC(NP({DEF ARTICLE}(the){COMPOUND NOUN}(booking system))COMMENT(VP(V{PASSIVE} (is accessed PP({PREPOSITION}via{DEFINITEARTICLE}(the){COMPOUND NOUN}(order entry application)))AS S0CIATI0N "booking system" "order entry application""booking system" {RECIPIENT} "order entry application""order entry application,,{AGENT} "booking system,,處理繼而移至步驟906,在此,由次級語義解析器304按照規則312來執行對FS的 第二語義解析,從而擴展復指和直指引用,並針對可變性較平來求解同義詞。FS 105的第一 段中的直指引用的求解以及第一段和第二段中的同義詞如下the->referent "booking system,,this->referent 『『order entry application,,information->referent 『『the destination,,+ 『『the price,,+ 『『special conditions,,處理繼而移至步驟907,在此,對初級語義解析器302插入的語義標記進行分析, 以識別在合併的本體204中的項之間的任何共同語義主題,並且將任何此類識別的主題標 記為關聯或者語義包含關係,如下在上面的示例中,『『details contained(所包含的細節)」關聯識別可以被解釋為 其相應主要名詞(也即,『『booking system")的屬性,或者被解釋為與主要名詞具有包含關 系的獨立類的特徵。如下面進一步描述的,映射模塊202布置用於使用該語義聚類數據來 確定是否存在任何「details contained」條目與本體中的任何其他賓語相關聯。如果存在, 則將其建模為其自己的類。如果條目不具有其他關聯,其將變為相應主體名詞類的屬性。處 理繼而移至步驟908,在此,將提取的本體傳遞至映射模塊202以供進一步處理,並且處理 結束於步驟909。現在將參考圖10的流程圖進一步詳細描述在將接收的本體204映射至MML模 型206時由映射模塊202執行的處理。響應於建模應用程式104的啟動,過程開始於步驟 1001,並且處理移至步驟1002。在步驟1002處,輸入本體204,並且處理移至步驟1003。在 步驟1003處,識別本體中的每個名詞短語,並且過程移至步驟1004。在步驟1004處,針對每 個識別的名詞短語創建EClass,並且處理移至步驟1005。在步驟1005處,按照映射表205 從本體中識別針對每個新EClass的相關特徵。而且,映射模塊202布置用於使用語義聚類 數據來確定是否存在任何「details contained」條目與本體中的任何其他對象相關聯。如 果存在,則針對相關的詳細條目創建新類以及與其關聯類的包含關係。如果詳細條目沒有其他關聯,則將其提供為其關聯類的屬性。處理繼而移至步驟1006,在此,為每個新EClass 填入識別的特徵,並且處理移至步驟1007。在步驟1007處,按照映射表205識別本體204中與所創建的EClass相關聯的任何 其他關係,諸如動詞短語。對於所識別的關係,按照映射表205並且如每個給定關係的指定 語義所確定的,針對相關的EClass來創建EReference或者EOperation。處理繼而移至步 驟1008,在此識別本體204中的任何語義主題聚類,並且處理移至步驟1009。在步驟1009 處,通過利用適當的標識符為相關EClass添加標記,來將所識別的語義聚類轉譯為MML模 型206。圖7示出了針對圖5的已提取本體204而產生的MML模型206。處理繼而移至步 驟1010,在此將MML模型206傳遞至模型創建模塊203,以便轉換為相關的UML模型106。 圖8示出了針對圖5的已提取本體204而產生的UML模型105的片段。處理繼而結束於步 驟 1011。本領域技術人員將會理解,從自然語言文本中提取的本體數據是由NLP模塊所使 用的詞典、語法和其他規則來確定的,並且因此可以被修改為適於特定的應用。可以從自然 語言中提取不同的數據集,並且通過本體來表示它們,以供建模應用程式使用。注意,並非 給定本體中的所有特徵都可以映射到MML模型中。本領域技術人員將會理解,具體化本發明的部分或者全部的裝置可以是通用設 備,其具有布置用於提供本發明的部分或全部實施方式的軟體。該設備可以是單個設備或 是設備群組,並且軟體可以是單個程序或者一組程序。此外,用來實現本發明的任意或者所 有軟體可以經由任何適當的傳輸或者存儲裝置來傳送,使得軟體可以加載到一個或多個設 備上。儘管已經通過對本發明實施方式的描述示出了本發明,並且這些實施方式是相當 詳細地描述的,但是發明人的意圖並非將所附權利要求的範圍約束或者以任何方式限制為 這些細節。附加的優點和修改對於本領域技術人員而言將是易見的。因此,本發明在其較為 寬泛的方面不限於特定細節的代表性裝置和方法以及示出和描述的說明性示例。由此,在 不脫離發明人的總體發明概念的精神和範圍的前提下,可以脫離這些細節。
權利要求
一種用於從系統的自然語言說明書中自動提取針對所述系統的系統建模元模型語言模型的方法,所述方法包括步驟a)從系統的自然語言說明書中提取句法結構,所述句法結構表示一個或多個句法主語的集合;b)創建所述句法主語的預定集合與系統建模元模型語言的相應元模型元素之間的第一映射;c)對於每個已識別的句法主語,按照所述映射來創建一個或多個所述元模型元素;以及d)提供所述創建的元模型結構元素,以便轉換為所述系統的模型。
2.根據權利要求1的方法,其中所述句法主語包括名詞短語,並且所述第一映射包括 相應的名詞短語向所述相應元模型結構元素的映射。
3.根據權利要求1或2中任一項的方法,包括進一步的步驟e)提取表示與每個所述句法主語相對應的一個或多個句法謂語的集合的進一步的句 法結構;f)創建所述句法謂語的預定集合與所述元模型元素的相應元模型關聯之間的第二映 射;以及g)按照所述提取的句法結構中識別的任何相應謂語,創建針對每個所述相應元模型結 構元素的一個或多個相應的元模型關係。
4.根據權利要求3的方法,其中,如果所述謂語包括名詞短語,則按照所述第一映射將 相應的名詞短語映射為進一步的元模型結構元素。
5.根據任一前述權利要求的方法,其中,所述元模型結構元素是元模型類。
6.根據權利要求3的方法,包括進一步的步驟g)從所述自然語言說明書中提取一個或多個語義元素;以及h)如果與給定謂語相關聯的語義元素指示所述謂語是被動式的,則將來自所述謂語的 動詞短語映射為針對所述相應主語的所述元模型結構元素與針對所述動詞短語的相應賓 語的所述元模型結構元素之間的元模型引用。
7.根據權利要求6所述的方法,其中如果所述語句謂語是主動式的,則將所述主動式 謂語的所述動詞短語映射為針對與所述主語相對應的所述元模型結構元素的元模型操作。
8.根據權利要求6或7中的任一項所述的方法,其中所述語義元素的集合包括與一個 或多個所述主語或者賓語相關聯的可選語義元素的集合,其被映射為所述相應元模型結構 元素的一個或多個屬性。
9.根據權利要求8的方法,其中根據所述可選語義元素來確定用以識別共同語義主題 的主題聚類數據,並將所述主題聚類數據轉譯為所述相應元模型元素,從而支持對所述系 統的所述模型中的所述共同語義主題的標識。
10.根據任一前述權利要求的方法,其中將與每個所述句法結構元素或者關係相關聯 的表面結構元素轉譯為針對所述相應元模型元素或者關係的標籤。
11.根據權利要求6到10中的任一項的方法,其中所述語義元素的所述提取包括用於 求解語義同義詞的可變性校平過程。
12.根據任一前述權利要求的方法,其中使用統一建模語言(UML)來創建所述模型。
13.根據任一前述權利要求的方法,其中所述元模型語言是Ecore 。
14.根據任一前述權利要求的方法,其中系統的所述自然語言說明書是高層功能說明 書(HLFS)。
15.一種用於從系統的自然語言說明書中自動提取針對所述系統的系統建模元模型語 言模型的裝置,所述裝置可操作以從系統的自然語言說明書中提取句法結構,所述句法結構表示一個或多個句法主語的 集合;創建所述句法主語的預定集合與系統建模元模型語言的相應元模型元素之間的第一 映射;對於每個已識別的句法主語,按照所述映射來創建一個或多個所述元模型元素;以及提供所述創建的元模型結構元素,以便轉換為所述系統的模型。
16.根據權利要求15的裝置,其中所述句法主語包括名詞短語,並且所述第一映射包 括相應的名詞短語向所述相應元模型結構元素的映射。
17.根據權利要求15或16的裝置,進一步可操作以提取表示與每個所述句法主語相對應的一個或多個句法謂語的集合的進一步的句法 結構;創建所述句法謂語的預定集合與所述元模型元素的相應元模型關聯之間的第二映射;以及按照所述提取的句法結構中識別的任何相應謂語,創建針對每個所述相應元模型結構 元素的一個或多個相應的元模型關係。
18.根據權利要求17中的任一項的裝置,其中,如果所述謂語包括名詞短語,則按照所 述第一映射將相應的名詞短語映射為進一步的元模型結構元素。
19.根據權利要求15到18中的任一項的裝置,其中,所述元模型結構元素是元模型類。
20.根據權利要求17的裝置,進一步可操作以從所述自然語言說明書中提取一個或多個語義元素;以及如果與給定謂語相關聯的語義元素指示所述謂語是被動式的,則將來自所述謂語的動 詞短語映射為針對所述相應主語的所述元模型結構元素與針對所述動詞短語的相應賓語 的所述元模型結構元素之間的元模型引用。
21.根據權利要求20所述的裝置,其中如果所述語句謂語是主動式的,則將所述主動 式謂語的所述動詞短語映射為針對與所述主語相對應的所述元模型結構元素的元模型操 作。
22.根據權利要求20或21所述的裝置,其中所述語義元素的集合包括與一個或多個所 述主語或者賓語相關聯的可選語義元素的集合,其被映射為所述相應元模型結構元素的一 個或多個屬性。
23.根據權利要求22的裝置,其中根據所述可選語義元素來確定用以識別共同語義主 題的主題聚類數據,並將所述主題聚類數據轉譯為所述相應元模型元素,從而支持對所述 系統的所述模型中的所述共同語義主題的標識。
24.根據權利要求15到23中的任一項的裝置,其中將與每個所述句法結構元素或者關 系相關聯的表面結構元素轉譯為針對所述相應元模型元素或者關係的標籤。
25.根據權利要求20到24中的任一項的裝置,其中所述語義元素的所述提取包括用於 求解語義同義詞的可變性校平過程。
26.根據權利要求15到25中的任一項的裝置,其中使用統一建模語言(UML)來創建所 述模型。
27.根據權利要求15到26中的任一項的裝置,其中所述元模型語言是Ecore 。
28.根據權利要求15到27中的任一項的裝置,其中系統的所述自然語言說明書是高層 功能說明書(HLFS)。
29.一種電腦程式,包括程序代碼裝置,當所述程序在計算機上運行時,所述程序代 碼裝置適於執行如權利要求中的1到14任一項的方法。
30.一種電腦程式,包括程序代碼裝置,當所述程序在計算機上運行時,所述程序代 碼裝置適於提供如權利要求中的15到28任一項的裝置。
31.一個或多個程序的群組,其布置用於使得一個或多個可編程設備的群組能夠執行 如權利要求1到14中的任一項的方法或者提供如權利要求15到28中的任一項的裝置。
全文摘要
本申請公開了用於自動提取系統建模元模型語言模型的方法和裝置。具體地,公開了用於從系統的自然語言說明書中自動提取系統建模元模型語言模型的方法、裝置和軟體。
文檔編號G06F17/27GK101872341SQ201010166958
公開日2010年10月27日 申請日期2010年4月22日 優先權日2009年4月23日
發明者E·門古索格魯, J·B·皮克寧 申請人:國際商業機器公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀