新四季網

修改源的定位方法及裝置、計算機設備及可讀介質與流程

2023-12-05 07:34:16


【技術領域】

本發明涉及計算機應用技術領域,尤其涉及一種修改源的定位方法及裝置、計算機設備及可讀介質。



背景技術:

為了更加方便用戶使用應用(application;app),現有技術中,很多應用均支持語音輸入,這樣,用戶在使用時僅需要向該app輸入語音數據即可,操作簡單,使用方便。

例如,用戶在文本編輯時,app可以接收用戶輸入的語音糾錯指令,然後根據用戶的語音糾錯指令的語義解析信息,在待修改文本中精確定位修改源,並後續進行文本糾錯。現有技術中,可以採用模板匹配定位的方法,根據預先設置的定位修改源的模塊,從語音糾錯指令的語義解析信息中定位修改源。

但是,現有技術的採用模板匹配定位的方法,僅能夠支持有限的特定模板,修改源的定位方式較為死板,且定位修改源的效率較低。



技術實現要素:

本發明提供了一種修改源的定位方法及裝置、計算機設備及可讀介質,用於豐富修改源定位的靈活性,提高修改源的定位效率。

本發明提供一種修改源的定位方法,所述方法包括:

從用戶輸入的語音糾錯指令的語義解析信息中,獲取標識修改源的第一目標詞以及所述修改源的限定參數;

根據所述第一目標詞以及所述限定參數,從待糾錯的文本中定位所述修改源。

進一步可選地,如上所述的方法中,根據所述第一目標詞以及所述限定參數,從待糾錯的文本中定位所述修改源,具體包括:

根據所述限定參數,從所述待糾錯的文本中查找所述第一目標詞;

若查找到,則確定定位到所述修改源,並返回所述修改源的位置信息。

進一步可選地,如上所述的方法中,還包括:

若從所述待糾錯的文本中未查找所述第一目標詞,根據所述限定參數,從所述待糾錯的文本中對所述第一目標詞進行文本模糊定位。

進一步可選地,如上所述的方法中,根據所述限定參數,從所述待糾錯的文本中對所述第一目標詞進行文本模糊定位,具體包括:

將所述第一目標詞進行同語義轉換,得到第二目標詞;

根據所述限定參數,從所述待糾錯的文本中查找所述第二目標詞;

若查找到,則確定定位到所述修改源,並返回所述修改源的位置信息。

進一步可選地,如上所述的方法中,根據所述限定參數,從所述待糾錯的文本中對所述目標詞進行文本模糊定位,具體包括:

將所述第一目標詞進行相似性轉換,得到所述第三目標詞,且所述第三目標詞與所述第一目標詞之間的編輯距離與所述第一目標詞的最大編輯距離的比例,小於或者等於預設編輯距離比例閾值;

根據所述限定參數,從所述待糾錯的文本中查找所述第三目標詞;

若查找到,則確定定位到所述修改源,並返回所述修改源的位置信息。

進一步可選地,如上所述的方法中,還包括:

若在所述文本模糊定位中未定位到所述修改源,根據所述限定參數,從所述待糾錯的文本中對所述第一目標詞進行注音模糊定位。

進一步可選地,如上所述的方法中,根據所述限定參數,從所述待糾錯的文本中對所述第一目標詞進行注音模糊定位,具體包括:

將所述第一目標詞中每個字進行真實注音;

根據所述第一目標詞中的各字的真實注音,為具有混淆發音的各字擴展混淆注音;

根據所述第一目標詞中各字的所述真實注音和所述混淆注音,生成對應的所述字的注音集;

根據所述限定參數,按照所述第一目標詞中各所述字的順序,從所述待糾錯的文本中查找第一疑似目標詞,所述第一疑似目標詞中各字的讀音依次與所述第一目標詞中對應位置的各所述字的所述注音集中的所述真實注音或者所述混淆注音相匹配;

若查找到,則確定定位到所述修改源,並返回所述修改源的位置信息;

否則,進一步根據所述限定參數,按照所述第一目標詞中各所述字的順序,從所述待糾錯的文本中查找第二疑似目標詞;所述第二疑似目標詞中,讀音與所述第一目標詞中對應位置的各所述字的所述注音集中的所述真實注音或者所述混淆注音相匹配的字的數量,佔所述第一目標詞包括的字的總數的比例,大於或者等於預設字比例閾值;

若查找到,則確定定位到所述修改源,並返回所述修改源的位置信息。

進一步可選地,如上所述的方法中,所述限定參數包括精確位置、相對位置、覆蓋範圍、相對位置關聯詞以及描述詞中的至少一種參數類別;

進一步地,根據所述第一目標詞以及所述限定參數,從待糾錯的文本中定位所述修改源,具體包括:

根據所述限定參數所包括的參數類別,獲取對應的定位接口;

向所述定位接口發送所述第一目標詞以及所述限定參數,由所述定位接口根據所述第一目標詞以及所述限定參數,從待糾錯的文本中定位所述修改源。

本發明提供一種修改源的定位裝置,所述裝置包括:

獲取模塊,用於從用戶輸入的語音糾錯指令的語義解析信息中,獲取標識修改源的第一目標詞以及所述修改源的限定參數;

定位模塊,用於根據所述第一目標詞以及所述限定參數,從待糾錯的文本中定位所述修改源。

進一步可選地,如上所述的裝置中,所述定位模塊,具體用於:

根據所述限定參數,從所述待糾錯的文本中查找所述第一目標詞;

若查找到,則確定定位到所述修改源,並返回所述修改源的位置信息。

進一步可選地,如上所述的裝置中,所述定位模塊,具體還用於若從所述待糾錯的文本中未查找所述第一目標詞,根據所述限定參數,從所述待糾錯的文本中對所述第一目標詞進行文本模糊定位。

進一步可選地,如上所述的裝置中,所述定位模塊,具體還用於:

將所述第一目標詞進行同語義轉換,得到第二目標詞;

根據所述限定參數,從所述待糾錯的文本中查找所述第二目標詞;

若查找到,則確定定位到所述修改源,並返回所述修改源的位置信息。

進一步可選地,如上所述的裝置中,所述定位模塊,具體還用於:

將所述第一目標詞進行相似性轉換,得到所述第三目標詞,且所述第三目標詞與所述第一目標詞之間的編輯距離與所述第一目標詞的最大編輯距離的比例,小於或者等於預設編輯距離比例閾值;

根據所述限定參數,從所述待糾錯的文本中查找所述第三目標詞;

若查找到,則確定定位到所述修改源,並返回所述修改源的位置信息。

進一步可選地,如上所述的裝置中,所述定位模塊,具體還用於若在所述文本模糊定位中未定位到所述修改源,根據所述限定參數,從所述待糾錯的文本中對所述第一目標詞進行注音模糊定位。

進一步可選地,如上所述的裝置中,所述定位模塊,具體還用於:

將所述第一目標詞中每個字進行真實注音;

根據所述第一目標詞中的各字的真實注音,為具有混淆發音的各字擴展混淆注音;

根據所述第一目標詞中各字的所述真實注音和所述混淆注音,生成對應的所述字的注音集;

根據所述限定參數,按照所述第一目標詞中各所述字的順序,從所述待糾錯的文本中查找第一疑似目標詞,所述第一疑似目標詞中各字的讀音依次與所述第一目標詞中對應位置的各所述字的所述注音集中的所述真實注音或者所述混淆注音相匹配;

若查找到,則確定定位到所述修改源,並返回所述修改源的位置信息;

否則,進一步根據所述限定參數,按照所述第一目標詞中各所述字的順序,從所述待糾錯的文本中查找第二疑似目標詞;所述第二疑似目標詞中,讀音與所述第一目標詞中對應位置的各所述字的所述注音集中的所述真實注音或者所述混淆注音相匹配的字的數量,佔所述第一目標詞包括的字的總數的比例,大於或者等於預設字比例閾值;

若查找到,則確定定位到所述修改源,並返回所述修改源的位置信息。

進一步可選地,如上所述的裝置中,所述限定參數包括精確位置、相對位置、覆蓋範圍、相對位置關聯詞以及描述詞中的至少一種參數類別;

進一步地,所述定位模塊,具體還用於:

根據所述限定參數所包括的參數類別,獲取對應的定位接口;

向所述定位接口發送所述第一目標詞以及所述限定參數,由所述定位接口根據所述第一目標詞以及所述限定參數,從待糾錯的文本中定位所述修改源。

本發明還提供一種計算機設備,所述設備包括:

一個或多個處理器;

存儲器,用於存儲一個或多個程序,

當所述一個或多個程序被所述一個或多個處理器執行,使得所述一個或多個處理器實現如上所述的修改源的定位方法。

本發明還提供一種計算機可讀介質,其上存儲有電腦程式,該程序被處理器執行時實現如上所述的修改源的定位方法。

本發明的修改源的定位方法及裝置、計算機設備及可讀介質,通過從用戶輸入的語音糾錯指令的語義解析信息中,獲取標識修改源的第一目標詞以及修改源的限定參數;根據第一目標詞以及修改源的限定參數,從待糾錯的文本中定位修改源。與現有技術的採用模板匹配定位的方案相比,本發明的技術方案能夠支持任意形式的語音糾錯指令,修改源的定位方式較為靈活,從而能夠有效地提高修改源的定位效率。

【附圖說明】

圖1為本發明的修改源的定位方法實施例一的流程圖。

圖2為本發明的三個修改源的限定參數的示例圖。

圖3為本發明的修改源的定位方法實施例二的流程圖。

圖4為本發明的修改源定位的使用場景圖。

圖5為本發明的修改源定位的流程示意圖。

圖6為本發明的修改源的定位裝置實施例一的結構圖。

圖7為本發明的修改源的定位裝置實施例二的結構圖。

圖8為本發明的計算機設備實施例的結構圖。

圖9為本發明提供的一種計算機設備的示例圖。

【具體實施方式】

為了使本發明的目的、技術方案和優點更加清楚,下面結合附圖和具體實施例對本發明進行詳細描述。

圖1為本發明的修改源的定位方法實施例一的流程圖。如圖1所示,本實施例的修改源的定位方法,具體可以包括如下步驟:

100、從用戶輸入的語音糾錯指令的語義解析信息中,獲取標識修改源的第一目標詞以及修改源的限定參數;

本實施例的修改源的定位方法的執行主體為修改源的定位裝置,本實施例的修改源的定位裝置應用在支持語音輸入的應用或者平臺中。具體地,修改源的定位裝置可以接收用戶輸入的語音糾錯指令,並將語音糾錯指令解析為文本形式的語義解析信息。或者由修改源的定位裝置所嵌入的應用或者平臺來接收用戶輸入的語音糾錯指令,並對用戶輸入的語音糾錯指令進行解析,得到文本形式的語義解析信息。然後由修改源的定位裝置根據該語義解析信息,進行修改源的定位。本實施例中,用戶輸入的語音糾錯指令中具體可以包括修改源。但是考慮到語義解析時,難免會有解析誤差,因此對語音糾錯指令解析得到的語義解析信息中包括的第一目標詞本身是用於標識修改源,或者也可以說是描述修改源。但如果正確標識了,該第一目標詞就等於修改源,若存在解析誤差,該第一目標詞便不能正確標識該修改源,此時該第一目標詞便不等同於修改源。因此,本實施例中,語義解析信息中包括的第一目標詞僅能夠標識修改源,未必等於修改源。

本實施例中的修改源的限定參數可以包括多種類別,具體用於描述修改源,便於確定修改源的位置的一些參數。例如修改源的限定參數中可以包括修改源的精確位置、修改源的相對位置、修改源的覆蓋範圍、修改源的相對位置關聯詞以及修改源的描述詞中的至少一種參數類別。例如,用戶的語音糾錯指令可以為「將第一個我們之後的組裝的組字修改為祖宗的祖字」,「把第5個字改成藍」,「在你後加個不好」等等。所有的糾錯指令中都包括糾錯意圖,即增加、修改或者刪除。本實施例的技術方案,主要用於對糾錯意圖為修改的修改源進行定位。糾錯指令中除了糾錯意圖還可以包括修改源的各類別的限定參數,如下述表1所示,解釋修改源的5種類別的限定參數以及標識修改源的第一目標詞。

表1

例如圖2為本發明的三個修改源的限定參數的示例圖。根據上述修改源的各種類別的限定參數的描述,可以知道,在例1.1中,「第三個我們」中,精確位置actual_pos為3,第一目標詞pre_ope_error為我們。在例1.2中,「南京後面的好」中,第一目標詞pre_ope_error為好,描述詞pre_ope_word為南京,相對位置relative_pos為after。在例1.3中,「南京的南」中,第一目標詞pre_ope_error為南,描述詞pre_ope_word為南京。其它語音糾錯指令的語義解析可以按照各限定參數的定義,從語義解析中獲取修改源的各限定參數。

101、根據第一目標詞以及修改源的限定參數,從待糾錯的文本中定位修改源。

由於修改源的限定參數用於限定修改源,第一目標詞用於標識修改源,因此,可以根據第一目標詞以及修改源的限定參數,在待糾錯的文本中定位修改源。

本實施例的修改源的定位方法,通過從用戶輸入的語音糾錯指令的語義解析信息中,獲取標識修改源的第一目標詞以及修改源的限定參數;根據第一目標詞以及修改源的限定參數,從待糾錯的文本中定位修改源。與現有技術的採用模板匹配定位的方案相比,能夠支持任意形式的語音糾錯指令,修改源的定位方式較為靈活,從而能夠有效地提高修改源的定位效率。

圖3為本發明的修改源的定位方法實施例二的流程圖。如圖3所示,本實施例的修改源的定位方法,具體可以包括如下步驟:

200、從用戶輸入的語音糾錯指令的語義解析信息中,獲取標識修改源的第一目標詞以及修改源的限定參數;

201、根據限定參數,從待糾錯的文本中查找第一目標詞;

202、判斷從待糾錯的文本中是否查找到第一目標詞,若查找到,執行步驟203;若未查找到,執行步驟204;

203、確定定位到修改源,並返回修改源的位置信息,結束。

此時定位的修改源等於第一目標詞,定位到修改源之後,表示定位成功,此時可以返回修改源的位置信息。例如,本實施例的修改源的位置信息可以為結構化的位置信息。定位到修改源的位置信息之後,通過返回修改源的位置信息,後續可以根據修改源的位置信息,進行修改。

204、根據限定參數,從待糾錯的文本中對第一目標詞進行文本模糊定位;執行步驟205;

205、判斷文本模糊定位是否成功,若定位成功,執行步驟203;否則若定位未成功,執行步驟206;

本實施例的從待糾錯的文本中對第一目標詞進行文本模糊定位成功時,此時修改源不等於第一目標詞。

具體地,根據限定參數,從待糾錯的文本中對第一目標詞進行文本模糊定位,具體可以包括如下兩種方式:

第一種方式為對第一目標詞進行同義轉換之後進行文本模糊定位。此時步驟204具體可以包括如下步驟:

(a1)將第一目標詞進行同語義轉換,得到第二目標詞;

(a2)根據限定參數,從待糾錯的文本中查找第二目標詞;若查找到,文本模糊定位成功,則執行步驟203;若未查找到,文本模糊定位未成功,繼續執行步驟206。

此時步驟203確定定位到的是包括第二目標詞的修改源,並返回修改源的位置信息。也就是說,此時第二目標詞等於修改源。

本實施例中,對於將待糾錯的文本與需要定位的第一目標詞的內容出現不一致時,將第一目標詞的內容同語義轉換後進行匹配,例如,本實施例的同語義轉換可以包括特殊符號、數字等進行全半角轉換。例如以前是全形,轉換為半角,以前是半角轉換為全形等。還可以包括文字到符號轉換,數字轉換、標點符號省略等等。例如,將文本數字「一百」轉換成阿拉伯數字「100」;這些轉換都不改變第一目標詞的語義,所以統稱為同語義轉換,並將轉換之後的目標詞稱為第二目標詞。此時根據限定參數,從待糾錯的文本中查找第二目標詞;若查找到,則表示定位到的是包括第二目標詞的修改源,定位成功,此時返回修改源的位置信息。否則可以再次對第一目標詞進行同語義轉換,直到完成對第一目標詞的所有同語義轉換之後,還未定位到修改源,此時可以確定定位失敗,此時再執行步驟206。

第二種方式為對第一目標詞進行相似性轉換,得到第三目標詞之後進行文本模糊定位。

此時步驟204具體可以包括如下步驟:

(b1)將第一目標詞進行相似性轉換,得到第三目標詞;

(b2)根據限定參數,從待糾錯的文本中查找第三目標詞;若查找到,文本模糊定位成功,則執行步驟203;若未查找到,文本模糊定位未成功,繼續執行步驟206。

此時步驟203確定定位到的是包括第三目標詞的修改源,並返回修改源的位置信息。也就是說,此時第三目標詞等於修改源。

其中的第三目標詞與第一目標詞之間的編輯距離與第一目標詞的最大編輯距離的比例,小於或者等於預設編輯距離比例閾值。其中第一目標詞的最大編輯距離可以為將第一目標詞全部修改的距離,若第一目標詞包括五個字,那麼最大編輯距離便為5。修改第一目標詞中的一個字,對應的編輯距離為1,修改第一目標詞中的兩個字,對應的編輯距離為2,以此類推。也就是說,本實施例的相似性轉換允許對第一目標詞進行少許編輯,得到第三目標詞。但是編輯的距離與第一目標詞的最大編輯距離的比例,必須小於或者等於預設編輯距離比例閾值,否則修改後的第三目標詞不被認同。然後,可以根據限定參數,從待糾錯的文本中查找第三目標詞;若查找到,則確定定位到修改源,並返回修改源的位置信息。否則可以再次對第一目標詞進行相似性轉換,直到完成對第一目標詞的所有相似性轉換之後,還未定位到修改源,此時可以確定定位失敗,此時再執行步驟206。

本實施例通過編輯距離進行相似性轉換,定位相似文本,可以召回由於語義識別導致相同內容被識別成不同文本的case和用戶通過相似文本做修改的case。例如,相似性轉換時,可以將「7748」修改後「7788」,可以實現在滿足預設編輯距離比例閾值的情況下,定位到修改源,並返回修改源的結構化的位置信息,在保證準確率的同時提高召回率。

206、根據限定參數,從待糾錯的文本中對第一目標詞進行注音模糊定位;執行步驟207;

207、判斷注音模糊定位是否成功,若定位成功,執行步驟203;否則若定位未成功,返回定位未成功的提示消息。

由於本實施例中的第一目標詞為從對用戶輸入的語音糾錯指令進行語義解析得到的語義解析信息中提取的,由於在語音識別中,對於相同的發音在上下文不同的情況下可能會被識別成不同的文本,這樣的case可以通過注音模糊定位來召回。再例如,有的用戶帶有一定的口音,例如有的用戶捲舌和平舌不分,例如,「zh」和「z」、「sh」和「s」、「l」和「n」等不分,所以造成用戶輸入的語音糾錯指令中描述的修改源是錯誤的,本實施例中通過注音模糊定位,可以提高對修改源的定位效率,提高信息召回率,增強定位的容錯率。

例如,本實施例的根據限定參數,從待糾錯的文本中對第一目標詞進行注音模糊定位,具體可以包括如下步驟:

(c1)將第一目標詞中每個字進行真實注音;

(c2)根據第一目標詞中的各字的真實注音,為具有混淆發音的各字擴展混淆注音;

本實施例的混淆發音可以為所有帶有平舌音的注音對應的捲舌音的注音,以及所有帶有捲舌音的注音對應的平舌音的注音。

(c3)根據第一目標詞中各字的真實注音和混淆注音,生成對應的字的注音集;

對於第一目標詞中的每個字,可以將該字的真實注音以及該字的所有混淆注音生成該字的一個注音字。這樣,在後續查找時,某個字只要與注音集中該字的一個注音(不論是真實注音還是混淆注音)相匹配,就認為與該字相匹配。

(c4)根據限定參數,按照第一目標詞中各字的順序,從待糾錯的文本中查找第一疑似目標詞,其中第一疑似目標詞中各字的讀音依次與第一目標詞中對應位置的各字的注音集中的真實注音或者混淆注音相匹配;若查找到,執行步驟203;否則,若未查找到,執行步驟(c5)

也就是說,第一目標詞與第一疑似目標詞中包括的字數是相同的,且第一疑似目標詞的第一個字的讀音與第一目標詞中第一個字的注音集中的真實注音或者混淆注音相同;同理,第一疑似目標詞的第二個字的讀音與第一目標詞中第二個字的注音集中的真實注音或者混淆注音相同;依次類推,第一疑似目標詞的每一個位置的字的讀音均與第一目標詞中對應位置的字的注音集中的真實注音或者混淆注音相同,這樣,才可以確定從待糾錯的文本中查找第一疑似目標詞。

此時步驟203確定定位到包括第一疑似目標詞的修改源,並返回修改源的結構化位置信息;也就是說,此時第一疑似目標詞等於修改源。

(c5)根據限定參數,按照第一目標詞中各字的順序,從待糾錯的文本中查找第二疑似目標詞;其中第二疑似目標詞中,讀音與第一目標詞中對應位置的各字的注音集中的真實注音或者混淆注音相匹配的字的數量,佔第一目標詞包括的字的總數的比例,大於或者等於預設字比例閾值;若查找到,執行步驟203;否則,定位未成功,返回定位未成功的提示消息。

此時步驟203確定定位到包括第二疑似目標詞的修改源,並返回所述修改源的位置信息。也就是說,此時第二疑似目標詞等於修改源。

具體地,本實施例中,第二疑似目標詞與第一疑似目標詞相比,不是每一個字的讀音均與第一目標詞的對應位置的字的注音集中的真實注音或者混淆注音相匹配。而是只要相匹配的字的數量,佔第一目標詞包括的字的總數的比例,大於或者等於預設字比例閾值;此時也可以認為定位成功,採用該技術方案,可以進一步提高信息的召回率,增強了定位修改源的容錯率。

本實施例的修改源的定位方法,通過採用上述技術方案,可以在根據限定參數,從待糾錯的文本中未查找第一目標詞的時候,進一步採用文本模糊定位和注音模糊定位實現對修改源的定位,能夠進一步提高信息的召回率,保證定位準確率的同時,提高對修改源定位的容錯率。

圖4為本發明的修改源定位的使用場景圖。如圖4所示,為本發明的修改源定位方法的一種示例。在該修改源的定位裝置可以採用上述圖1-圖3所示實施例的修改源的定位方法。具體地,在使用時,源文本的內容可以包括「真好,我也覺得南京號有文化底蘊」。對應地用戶輸入的語音糾錯指令對應的語義解析信息即指令文本可以包括「把南京後邊的好改成好壞的好」。此時修改源的定位裝置可以根據指令文本在源文本中對修改源進行定位,詳細可以參考上述圖1-圖3所示實施例的方法實現對修改源的定位,在此不再贅述。

進一步可選地,上述實施例中為修改源的定位裝置直接對各種類別的限定參數對應的修改源進行定位。實際應用中,修改源的定位裝置還可以設置多個定位接口,分別對各種類別的限定參數進行修改源定位。例如,本實施例中限定參數可以包括精確位置、相對位置、覆蓋範圍、相對位置關聯詞以及描述詞中五種類別中的至少一種參數類別。語音糾錯指令中可以包括任意一種、兩種或者多種參數類別。此時根據五種類別的限定參數,共可以得到2*2*2*2*2=32種限定參數的搭配。在設置定位接口(locater)時,可以針對每一種搭配,設置一種定位接口,這樣,共可以設置32種定位接口如locater_1、locater_2……locater_32。例如,圖5為本發明的修改源定位的流程示意圖。如圖5所示,修改源定位裝置獲取到各個限定參數之後,5種類別的限定參數對應採用不同的id來表示,例如本實施例中,採用1、2、3、4和5分別表示精確位置actual_pos、相對位置relative_pos、相對位置關聯詞relative_pos_word、描述詞pre_ope_word、以及覆蓋範圍與數量ope_word_num。如圖5所示,第一目標詞pre_ope_error為號,相對位置關聯詞relative_pos_word以及描述詞pre_ope_word分別為after和「南京」,此時對應的id3和4具有數值,因此,可以標識為1和1,此時可以採用對應的定位接口locater_6來進行修改源定位,即定位接口locater_6僅處理具有相對位置關聯詞relative_pos_word以及描述詞pre_ope_word兩種類別的限定參數的修改源的定位。本實施例中通過設置多個定位接口,可以避免修改源定位裝置對所有類別的限定參數都進行定位,處理過程繁瑣,通過根據不同類別的限定參數選擇不同的定位接口,可以將定位任務分發,操作非常簡單。實際應用中,限定參數的類別的數量發生變化時,定位接口的數量也發生變化,實際應用中,當包括定位接口時,可以設置至少兩個定位接口。否則定位接口的設置沒有意義。或者實際應用中還可以採用其他方式來設置定位接口,例如,還可以為若包括前三個參數由第一個定位接口負責對修改源進行定位處理,若包括後兩個參數由第二定位接口負責對修改源進行定位處理。

即,對於上述實施例中的步驟101「根據第一目標詞以及修改源的限定參數,從待糾錯的文本中定位所述修改源」,具體可以包括如下步驟:

(d1)根據限定參數所包括的參數類別,獲取對應的定位接口;

(d2)向定位接口發送第一目標詞以及限定參數,由定位接口根據第一目標詞以及限定參數,從待糾錯的文本中定位修改源。且本實施例中每一種定位接口的定位方法與上述圖1-圖3所示實施例相同,詳細可以參考上述圖1所示實施例的定位方法,在此不再贅述。

圖6為本發明的修改源的定位裝置實施例一的結構圖。如圖6所示,本實施例的修改源的定位裝置,具體可以包括:獲取模塊10和定位模塊11。

獲取模塊10用於從用戶輸入的語音糾錯指令的語義解析信息中,獲取標識修改源的第一目標詞以及修改源的限定參數;

定位模塊11用於根據獲取模塊10獲取的第一目標詞以及限定參數,從待糾錯的文本中定位修改源。

本實施例的修改源的定位裝置,通過採用上述模塊實現修改源的定位的實現原理以及技術效果與上述相關方法實施例的實現相同,詳細可以參考上述相關方法實施例的記載,在此不再贅述。

進一步可選地,本實施例的修改源的定位裝置中,定位模塊11具體用於:

根據獲取模塊10獲取的限定參數,從待糾錯的文本中查找獲取模塊10獲取的第一目標詞;

若查找到,則確定定位到修改源,並返回修改源的位置信息。

進一步可選地,本實施例的修改源的定位裝置中,定位模塊11具體還用於若從待糾錯的文本中未查找獲取模塊10獲取的第一目標詞,根據獲取模塊10獲取的限定參數,從待糾錯的文本中對獲取模塊10獲取的第一目標詞進行文本模糊定位。

進一步可選地,本實施例的修改源的定位裝置中,定位模塊11具體還用於:

將獲取模塊10獲取的第一目標詞進行同語義轉換,得到第二目標詞;

根據獲取模塊10獲取的限定參數,從待糾錯的文本中查找第二目標詞;

若查找到,則確定定位到修改源,並返回修改源的位置信息。

進一步可選地,本實施例的修改源的定位裝置中,定位模塊11具體還用於:

將獲取模塊10獲取的第一目標詞進行相似性轉換,得到第三目標詞,且第三目標詞與第一目標詞之間的編輯距離與第一目標詞的最大編輯距離的比例,小於或者等於預設編輯距離比例閾值;

根據獲取模塊10獲取的限定參數,從待糾錯的文本中查找第三目標詞;

若查找到,則確定定位到修改源,並返回修改源的位置信息。

進一步可選地,本實施例的修改源的定位裝置中,定位模塊11具體還用於若在文本模糊定位中未定位到修改源,根據獲取模塊10獲取的限定參數,從待糾錯的文本中對獲取模塊10獲取的第一目標詞進行注音模糊定位。

進一步可選地,本實施例的修改源的定位裝置中,定位模塊11具體還用於:

將獲取模塊10獲取的第一目標詞中每個字進行真實注音;

根據第一目標詞中的各字的真實注音,為具有混淆發音的各字擴展混淆注音;

根據第一目標詞中各字的真實注音和混淆注音,生成對應的字的注音集;

根據限定參數,按照第一目標詞中各字的順序,從待糾錯的文本中查找第一疑似目標詞,第一疑似目標詞中各字的讀音依次與第一目標詞中對應位置的各字的注音集中的真實注音或者混淆注音相匹配;

若查找到,則確定定位到修改源,並返回修改源的位置信息;

否則,進一步根據獲取模塊10獲取的限定參數,按照第一目標詞中各字的順序,從待糾錯的文本中查找第二疑似目標詞;第二疑似目標詞中,讀音與第一目標詞中對應位置的各字的注音集中的真實注音或者混淆注音相匹配的字的數量,佔第一目標詞包括的字的總數的比例,大於或者等於預設字比例閾值;

若查找到,則確定定位到修改源,並返回修改源的位置信息。

圖7為本發明的修改源的定位裝置實施例二的結構圖。如圖7所示,本實施例的修改源的定位裝置,在上述圖6所示實施例的技術方案的基礎上,還可以包括至少兩個定位接口12。各定位接口12可以與修改源的限定參數所包括的參數類別對應。

本實施例中的限修改源的限定參數包括精確位置、相對位置、覆蓋範圍、相對位置關聯詞以及描述詞中的至少一種參數類別;可以設置至少兩個定位接口,分別與一定的參數類別的組合相對應,例如,5種參數類別的不同組合,可以對應32個定位接口,詳細可以參考上述相關實施例的記載,在此不再贅述。

進一步地,此時,定位模塊11具體用於根據限定參數所包括的參數類別,獲取對應的定位接口12;並向對應的定位接口12發送獲取模塊10獲取的第一目標詞以及限定參數,由定位接口12根據第一目標詞以及限定參數,從待糾錯的文本中定位修改源。此時定位模塊11具有分發的功能,而不執行具體的修改原的定位,而由各定位接口12執行修改源的定位。其中定位接口12根據第一目標詞以及限定參數,從待糾錯的文本中定位修改源的方式,可以參考上述實施例中的定位模塊11根據第一目標詞以及限定參數,從待糾錯的文本中定位修改源的記載,在此不再贅述。

圖8為本發明的計算機設備實施例的結構圖。如圖8所示,本實施例的計算機設備,包括:一個或多個處理器30,以及存儲器40,存儲器40用於存儲一個或多個程序,當存儲器40中存儲的一個或多個程序被一個或多個處理器30執行,使得一個或多個處理器30實現如上圖1-圖7所示實施例的修改源的定位方法。圖8所示實施例中以包括多個處理器30為例。

例如,圖9為本發明提供的一種計算機設備的示例圖。圖9示出了適於用來實現本發明實施方式的示例性計算機設備12a的框圖。圖9顯示的計算機設備12a僅僅是一個示例,不應對本發明實施例的功能和使用範圍帶來任何限制。

如圖9所示,計算機設備12a以通用計算設備的形式表現。計算機設備12a的組件可以包括但不限於:一個或者多個處理器16a,系統存儲器28a,連接不同系統組件(包括系統存儲器28a和處理器16a)的總線18a。

總線18a表示幾類總線結構中的一種或多種,包括存儲器總線或者存儲器控制器,外圍總線,圖形加速埠,處理器或者使用多種總線結構中的任意總線結構的局域總線。舉例來說,這些體系結構包括但不限於工業標準體系結構(isa)總線,微通道體系結構(mac)總線,增強型isa總線、視頻電子標準協會(vesa)局域總線以及外圍組件互連(pci)總線。

計算機設備12a典型地包括多種計算機系統可讀介質。這些介質可以是任何能夠被計算機設備12a訪問的可用介質,包括易失性和非易失性介質,可移動的和不可移動的介質。

系統存儲器28a可以包括易失性存儲器形式的計算機系統可讀介質,例如隨機存取存儲器(ram)30a和/或高速緩存存儲器32a。計算機設備12a可以進一步包括其它可移動/不可移動的、易失性/非易失性計算機系統存儲介質。僅作為舉例,存儲系統34a可以用於讀寫不可移動的、非易失性磁介質(圖9未顯示,通常稱為「硬碟驅動器」)。儘管圖9中未示出,可以提供用於對可移動非易失性磁碟(例如「軟盤」)讀寫的磁碟驅動器,以及對可移動非易失性光碟(例如cd-rom,dvd-rom或者其它光介質)讀寫的光碟驅動器。在這些情況下,每個驅動器可以通過一個或者多個數據介質接口與總線18a相連。系統存儲器28a可以包括至少一個程序產品,該程序產品具有一組(例如至少一個)程序模塊,這些程序模塊被配置以執行本發明上述圖1-圖7各實施例的功能。

具有一組(至少一個)程序模塊42a的程序/實用工具40a,可以存儲在例如系統存儲器28a中,這樣的程序模塊42a包括——但不限於——作業系統、一個或者多個應用程式、其它程序模塊以及程序數據,這些示例中的每一個或某種組合中可能包括網絡環境的實現。程序模塊42a通常執行本發明所描述的上述圖1-圖7各實施例中的功能和/或方法。

計算機設備12a也可以與一個或多個外部設備14a(例如鍵盤、指向設備、顯示器24a等)通信,還可與一個或者多個使得用戶能與該計算機設備12a交互的設備通信,和/或與使得該計算機設備12a能與一個或多個其它計算設備進行通信的任何設備(例如網卡,數據機等等)通信。這種通信可以通過輸入/輸出(i/o)接口22a進行。並且,計算機設備12a還可以通過網絡適配器20a與一個或者多個網絡(例如區域網(lan),廣域網(wan)和/或公共網絡,例如網際網路)通信。如圖所示,網絡適配器20a通過總線18a與計算機設備12a的其它模塊通信。應當明白,儘管圖中未示出,可以結合計算機設備12a使用其它硬體和/或軟體模塊,包括但不限於:微代碼、設備驅動器、冗餘處理器、外部磁碟驅動陣列、raid系統、磁帶驅動器以及數據備份存儲系統等。

處理器16a通過運行存儲在系統存儲器28a中的程序,從而執行各種功能應用以及數據處理,例如實現上述實施例所示的修改源的定位方法。

本發明還提供一種計算機可讀介質,其上存儲有電腦程式,該程序被處理器執行時實現如上述實施例所示的修改源的定位方法。

本實施例的計算機可讀介質可以包括上述圖9所示實施例中的系統存儲器28a中的ram30a、和/或高速緩存存儲器32a、和/或存儲系統34a。

隨著科技的發展,電腦程式的傳播途徑不再受限於有形介質,還可以直接從網絡下載,或者採用其他方式獲取。因此,本實施例中的計算機可讀介質不僅可以包括有形的介質,還可以包括無形的介質。

本實施例的計算機可讀介質可以採用一個或多個計算機可讀的介質的任意組合。計算機可讀介質可以是計算機可讀信號介質或者計算機可讀存儲介質。計算機可讀存儲介質例如可以是——但不限於——電、磁、光、電磁、紅外線、或半導體的系統、裝置或器件,或者任意以上的組合。計算機可讀存儲介質的更具體的例子(非窮舉的列表)包括:具有一個或多個導線的電連接、可攜式計算機磁碟、硬碟、隨機存取存儲器(ram)、只讀存儲器(rom)、可擦式可編程只讀存儲器(eprom或快閃記憶體)、光纖、可攜式緊湊磁碟只讀存儲器(cd-rom)、光存儲器件、磁存儲器件、或者上述的任意合適的組合。在本文件中,計算機可讀存儲介質可以是任何包含或存儲程序的有形介質,該程序可以被指令執行系統、裝置或者器件使用或者與其結合使用。

計算機可讀的信號介質可以包括在基帶中或者作為載波一部分傳播的數據信號,其中承載了計算機可讀的程序代碼。這種傳播的數據信號可以採用多種形式,包括——但不限於——電磁信號、光信號或上述的任意合適的組合。計算機可讀的信號介質還可以是計算機可讀存儲介質以外的任何計算機可讀介質,該計算機可讀介質可以發送、傳播或者傳輸用於由指令執行系統、裝置或者器件使用或者與其結合使用的程序。

計算機可讀介質上包含的程序代碼可以用任何適當的介質傳輸,包括——但不限於——無線、電線、光纜、rf等等,或者上述的任意合適的組合。

可以以一種或多種程序設計語言或其組合來編寫用於執行本發明操作的電腦程式代碼,所述程序設計語言包括面向對象的程序設計語言—諸如java、smalltalk、c++,還包括常規的過程式程序設計語言—諸如」c」語言或類似的程序設計語言。程序代碼可以完全地在用戶計算機上執行、部分地在用戶計算機上執行、作為一個獨立的軟體包執行、部分在用戶計算機上部分在遠程計算機上執行、或者完全在遠程計算機或伺服器上執行。在涉及遠程計算機的情形中,遠程計算機可以通過任意種類的網絡——包括區域網(lan)或廣域網(wan)—連接到用戶計算機,或者,可以連接到外部計算機(例如利用網際網路服務提供商來通過網際網路連接)。

在本發明所提供的幾個實施例中,應該理解到,所揭露的系統,裝置和方法,可以通過其它的方式實現。例如,以上所描述的裝置實施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實際實現時可以有另外的劃分方式。

所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位於一個地方,或者也可以分布到多個網絡單元上。可以根據實際的需要選擇其中的部分或者全部單元來實現本實施例方案的目的。

另外,在本發明各個實施例中的各功能單元可以集成在一個處理單元中,也可以是各個單元單獨物理存在,也可以兩個或兩個以上單元集成在一個單元中。上述集成的單元既可以採用硬體的形式實現,也可以採用硬體加軟體功能單元的形式實現。

上述以軟體功能單元的形式實現的集成的單元,可以存儲在一個計算機可讀取存儲介質中。上述軟體功能單元存儲在一個存儲介質中,包括若干指令用以使得一臺計算機設備(可以是個人計算機,伺服器,或者網絡設備等)或處理器(processor)執行本發明各個實施例所述方法的部分步驟。而前述的存儲介質包括:u盤、移動硬碟、只讀存儲器(read-onlymemory,rom)、隨機存取存儲器(randomaccessmemory,ram)、磁碟或者光碟等各種可以存儲程序代碼的介質。

以上所述僅為本發明的較佳實施例而已,並不用以限制本發明,凡在本發明的精神和原則之內,所做的任何修改、等同替換、改進等,均應包含在本發明保護的範圍之內。

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀