新四季網

一種更新輸入法詞庫的方法及系統的製作方法

2023-08-06 08:06:21 2

專利名稱:一種更新輸入法詞庫的方法及系統的製作方法
技術領域:
本發明涉及輸入法技術領域,特別是涉及一種更新輸入法詞庫的方法及系統。
背景技術:
輸入法系統作為人機對話的接口,提供了將各種文字輸入計算機或其他設備(如手機)的編碼方法。換言之,對於需要編碼才能完成輸入的文字,如果想要將某些文字內容輸入到計算機中,則需要藉助於輸入法系統才能完成。因此,輸入法系統在人機互動過程中其中舉足輕重的作用。輸入法系統通常都具有自己的詞庫,對於中文、日文等文字而言,輸入法的詞庫中
保存了常用詞條以及對應的編碼字符串(如拼音等),當用戶通過鍵盤等輸入設備輸入了某編碼字符串之後,輸入法系統就可以通過查詢詞庫,將該編碼字符串對應的詞條展現給用戶。當然,由於同音字詞的存在,同一編碼字符串往往對應著多個詞條,但各個詞條的使用頻率可能各有不同,因此,詞庫中通常還保存有各個詞條對應的詞頻。這樣,當用戶輸入一個編碼字符串之後,如果發現對應著多個詞條,輸入法系統就可以依據詞頻由大到小的順序,將各個詞條展現給用戶。對於輸入法系統而言,詞庫的質量是衡量其性能的很重要的一個方面,一個高質量的詞庫能夠提高首選詞的命中率,進而提高字詞輸入的速度。目前的主流輸入法則是通過統計搜尋引擎中收錄的頁面中文字的出現概率來得到。具體實現時,首先由伺服器端通過網絡爬蟲抓取頁面,然後做分詞處理,再將其中的有效部分製作成詞庫,只有當伺服器端生成了新版本的詞庫,客戶端的輸入法詞庫才會得到更新。而這一周期會比較長,往往需要幾個月的時間,在實際應用中,涉及更多流程步驟,遷延的時期更長。每次作詞庫更新時,都需要重複該過程,因此,詞庫的更新周期會比較長。現有技術中,針對新詞,通常可以通過詞庫增量的方式,實現較短的更新周期。例如,有些輸入法系統可以每天或者用戶每次開機時,將新詞添加到輸入法詞庫中。但是,在實際應用中,還有些詞條具有以下特徵這些詞條在系統詞庫中存在,但相對於同音下的其他詞條而言,平均詞頻可能比較低,因此,當用戶輸入其編碼字符串時,該詞條在候選項中的排序可能比較靠後;但是,這些詞條卻可能存在階段性的使用頻率增高的現象(通常將這種詞條稱為熱詞),此時,如果仍然按照當前詞庫給出候選項,則會影響到輸入速度。如果等待伺服器端生成新的詞庫,則長的更新周期可能會導致該詞條的熱度可能已經過了,即使在新的詞庫中,該詞條的詞頻等發生了變化,也已經失去意義了。

發明內容
本發明提供一種更新輸入法詞庫的方法及系統,能夠針對熱詞實現較短的詞庫更新周期,有利於提高輸入法系統的性能。本發明提供了如下方案一種更新輸入法詞庫的方法,包括
獲取詞條更新信息;根據所述詞條更新信息對輸入法詞庫中已有詞條的屬性進行更新;依據更新後的詞條屬性提供候選項。優選地,所述詞條更新信息包括至少一個已有詞條的詞頻和/或多元關係的更新指示; 所述根據詞條更新信息對輸入法詞庫中已有詞條的屬性進行更新包括對輸入法詞庫中已有詞條的詞頻和/或多元關係進行更新。其中,所述對已有詞條的多元關係進行更新包括修改已有多元關係的強度、增加詞條之間新的多元關係、或刪除詞條之間已有的多元關係。優選地,所述詞條更新信息包括至少一個已有詞條的熱詞標籤更新指示;所述根據詞條更新信息對輸入法詞庫中已有詞條的屬性進行更新包括為輸入法詞庫中的已有詞條或已有詞條的多元關係添加熱詞標籤;所述依據更新後的詞條屬性提供候選項包括在展現候選項時,將帶有熱詞標籤的詞條或多元關係進行優先展現。其中,所述根據詞條更新信息對輸入法詞庫中已有詞條的屬性進行更新包括為輸入法詞庫中的已有詞條或已有詞條的多元關係刪除熱詞標籤。優選地,所述方法還包括獲取所述詞條更新信息的有效時間;當到達所述有效時間時,將所述輸入法詞庫中已有詞條的屬性恢復到更新前的狀態。優選地,所述獲取詞條更新信息包括從伺服器接收所述詞條更新信息。優選地,所述獲取詞條更新信息包括從預置的熱詞相關信息中,獲取所述詞條更新信息;所述熱詞相關信息包括已有詞條的屬性更新指示及觸發條件;所述根據詞條更新信息對輸入法詞庫中已有詞條的屬性進行更新包括在滿足所述觸發條件時,根據所述更新指示對已有詞條的屬性進行更新。一種更新輸入法詞庫的系統,包括詞條更新信息獲取單元,用於獲取詞條更新信息;更新單元,用於根據所述詞條更新信息對輸入法詞庫中已有詞條的屬性進行更新;候選項提供單元,用於依據更新後的詞條屬性提供候選項。優選地,所述詞條更新信息包括至少一個已有詞條的詞頻和/或多元關係的更新指示;所述更新單元包括第一更新子單元,用於對輸入法詞庫中已有詞條的詞頻和/或多元關係進行更新。其中,所述第一更新子單元對已有詞條的多元關係進行更新包括修改已有多元關係的強度、增加詞條之間新的多元關係、或刪除詞條之間已有的多元關係。優選地,所述詞條更新信息包括至少一個已有詞條的熱詞標籤更新指示;所述更新單元包括
第二更新子單元,用於為輸入法詞庫中的已有詞條或已有詞條的多元關係添加熱詞標籤;所述候選項提供單元具體用於在展現候選項時,將帶有熱詞標籤的詞條或多元關係進行優先展現。優選地,所述更新單元包括第三更新子單元,用於為輸入法詞庫中的已有詞條或已有詞條的多元關係刪除熱詞標籤。優選地,所述系統還包括有效時間獲取單元,用於獲取所述詞條更新信息的有效時間;屬性恢復單元,用於當到達所述有效時間時,將所述輸入法詞庫中已有詞條的屬·性恢復到更新前的狀態。優選地,所述詞條更新信息獲取單元包括第一獲取子單元,用於從伺服器接收所述詞條更新信息。優選地,所述詞條更新信息獲取單元包括第二獲取子單元,用於從預置的熱詞相關信息中,獲取所述詞條更新信息;所述熱詞相關信息包括已有詞條的屬性更新指示及觸發條件;所述更新單元具體用於在滿足所述觸發條件時,根據所述更新指示對已有詞條的屬性進行更新。根據本發明提供的具體實施例,本發明公開了以下技術效果本發明實施例中,可以將輸入法詞庫中已有詞條的屬性進行與時事相關的更新,進而改變候選項的展現,這樣,針對熱詞也能夠實現較短的更新周期,從而提高輸入法詞庫的質量,提高輸入速度。


為了更清楚地說明本發明實施例或現有技術中的技術方案,下面將對實施例中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發明的一些實施例,對於本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。圖I是本發明實施例提供的方法的流程圖;圖2是本發明實施例提供的系統的示意圖。
具體實施例方式下面將結合本發明實施例中的附圖,對本發明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發明一部分實施例,而不是全部的實施例。基於本發明中的實施例,本領域普通技術人員所獲得的所有其他實施例,都屬於本發明保護的範圍。首先,為了便於理解,首先對輸入法詞庫進行簡單的介紹。通常,輸入法詞庫中保存有詞條及其對應的詞頻,以及詞條之間的多元關係。其中,對於輸入法詞庫而言,傳統概念中的字、詞、詞組、句子、段落,凡能夠一次編碼輸入的都不加以區別,而作為同樣的一個數據輸入單元,統稱為「詞條」,也就是說,輸入法詞庫中的「詞條」可能是僅有一個字,也可能由多個字組成。如果用戶輸入了編碼字符串之後,能夠直接命中詞庫中的詞條,則該詞條就可以作為候選項展現給用戶供用戶選擇。其中,一個編碼字符串可能對應著多個詞條,此時,主要根據不同詞條之間的詞頻,對各個詞條進行排序之後,再展現給用戶。另外,為了實現輸入法系統的組詞功能,輸入法詞庫中還可以包括詞條之間的多元關係,輸入法系統根據多元關係可以知悉哪些詞條適於進行組合。例如,當用戶輸入一個長的短語或句子的編碼字符串時,可能不能直接命中詞庫中的單個詞條,此時,就可以根據詞條之間的多元關係,為用戶提供候選項。如,用戶輸入的是「ligangshijian」,詞庫中沒有預置對應的詞條,但是,存在「李剛」與「事件」之間的二元關係,或者,「離崗」與「時間」之間的二元關係;則可以首先將「ligang」轉換為「李剛」、「離崗」、「離港」等,並將「shijian」轉換為「時間」、「事件」、「實踐」 「世間」等等,然後,根據二元關係,為用戶提供「離崗時間」及「李剛事件」作為候選項。其中,同一編碼字符串同樣可能對應多個經組詞得到的詞條,為了確定各個組詞詞條的展現順序,輸入法詞庫中還可以保存多元關係之間的強度信息,這樣,就可以按照多元關係的強弱、或者詞頻和多元關係的強弱來確定組詞詞條在候選項中出現的位置。在展現候選項時,對於出現在第一位的候選項(通常稱為首選項),用戶可以直接按下「空格鍵」將其上屏輸出到應用程式中,而其他的候選項則需要按下數字鍵,甚至還需要按下「翻頁」鍵等才能將其上屏輸出。而通過直接按下空格鍵上屏的方式,最便於用戶的操作。因此,對於輸入法系統而言,首選項的命中率是很重要的。如果在用戶輸入的過程中,多數情況下,都能直接將用戶想要輸入的詞條展現在首選項的位置,則可以大大地提高輸入的速度。如前文所述,各個詞條在候選項中的位置,取決於詞條在輸入法詞庫中的詞頻或者多元關係的強度,因此,如果想要改變某詞條在候選項中的位置,則通常需要改變其在輸入法詞庫中的詞頻或多元關係的強度,使其與其他詞條的詞頻或多元關係強度的相對關係發生變化。但是,現有技術中要想實現這種變化,通常只有兩種途徑一種是安裝新版本的詞庫,另一種就是當用戶想要提高某詞條的詞頻時,可以採用連續多次輸入這個詞條的方式,使得本地詞庫中該詞條的詞頻累積到比較高的值。但是,前一種方式的更新周期比較長,對於與時事相關的熱詞而言,如此長的更新周期可能會使得新版本的詞庫中無法體現出熱詞的特點;而後一種方式則需要用戶進行手動的操作,比較不方便,並且這種操作僅能增加詞條的詞頻,無法降低,當過了一段時間詞條的熱度過了之後。則很難將其恢復到原來的詞頻。參見圖1,本發明實施例提供的更新輸入法詞庫的方法可以包括以下步驟SlOl :獲取詞條更新信息;該步驟的執行主體為輸入法系統的客戶端。具體實現時,客戶端可以從伺服器下載保存有詞條更新信息的更新文件,然後對該更新文件進行解析,從中獲取詞條更新信息。或者,詞條更新信息也可能是保存在客戶端本地,也即,也可以從客戶端本地獲取詞條更新信息。從詞條更新信息中,客戶端可以獲得針對哪個或哪些詞條屬性的更新指示。S102 :根據所述詞條更新信息對輸入法詞庫中已有詞條的屬性進行更新;其中,已有詞條的屬性可以包括已有詞條的詞頻、已有多元關係的強度等等。因此,獲得了詞條更新信息之後,客戶端就可以根據這些詞條更新信息對已有詞條屬性進行更新,例如,可以包括對已有詞條的詞頻、已有多元關係的強度等等進行修改,或者,還可以為已有詞條或多元關係添加或刪除熱詞標籤,或者,還可以增加新的多元關係或刪除已有的多兀關係,等等。S103 :依據更新後的詞條屬性提供候選項。在對已有詞條屬性的更新之後,就可以依據更新後的詞條屬性信息,來提供候選項,與未更新詞條屬性之前相比,候選項在顯示上的不同可能在於改變這些詞條或組詞詞條在候選項中的位置,或者,對於原來無法一次性給出的候選項,也能夠通過新增的多元關係,作為一個組詞詞條給出,等等。其中,對於修改詞條的詞頻或多元關係的方式而言,輸入法系統在展現候選項時展現規則可以不變,仍然按照詞頻或多元關係強度的大小進行排序。而對於為已有詞條或已有多元關係添加熱詞標籤的情況,則可以對展現規則進行修改,使得輸入法系統在確定候選項的展現順序時,優先考慮詞條是否帶有熱詞標識,然後再考慮詞頻即可;或者優先考慮組詞詞條的多元關係是否帶有熱詞標籤,然後再考慮多元關係 的強度或詞頻等因素。下面通過具體的實施方式,對本發明實施例進行詳細地介紹。實施方式一在該實施方式一中,客戶端可以從伺服器獲取詞條更新信息,在詞條更新信息中可以指明待更新的詞條是哪個或哪些,如果涉及詞頻或多元關係強度更改的,還可以指明更改後的詞頻或多元關係強度的具體數值,如果是新增某多元關係,還可以指明新增的是哪些詞條之間的多元關係,等等。在此情況下,在伺服器端,可以持續收集與時事等相關的熱詞,並在收集到熱詞之後,將需要更新的信息製作成更新文件供客戶端下載。這樣,客戶端就可以從下載得到的更新文件中獲取上述詞條更新信息,然後按照具體的信息內容進行更新即可。當然,在實際應用中,為了便於實現,還可以為更新文件加入版本號等標識。這樣,當客戶端聯網時就可以將上次更新時的更新文件版本與伺服器端的更新文件版本進行比對,如果發現有新版本,就可以下載到本地。其中,伺服器端收集熱詞的具體方法可以包括多種。例如,可以採用人工監控的方式來發現;或者,還可以基於搜索詞進行統計,也即,記錄網絡中的多個用戶在使用搜尋引擎進行搜索時,在搜索框內輸入的查詢詞,如果發現一段時間內,某詞條的查詢量非常大,則可以將其作為熱詞收集起來。或者,還可以根據直接數據源來獲取,所謂直接數據源可以包括新聞源、科研資料庫等等。在獲知了與時事相關的熱詞之後,具體在製作更新文件時,可以根據具體的熱詞以及輸入法詞庫的實際情況,確定需要更新的信息。其中,需要更新的信息主要包括對哪些詞條的何種屬性進行怎樣的更新。其中,如前文所述,詞條的屬性可以包括詞條的詞頻、或者,詞條之間是否具有多元關係、多元關係的強度,等等。相應的,對詞條的屬性進行更新時,可以包括對詞條的詞頻進行更新、對已有多元關係的強度進行更新,或者,增加新的多兀關係、刪除已有的多兀關係,等等。例如,收集到的某熱詞是「李剛」,則需要更新的信息首先可以包括「李剛」這個詞條,以及為該詞條設置的新的詞頻。同時,與該熱詞相關的可能還有「李剛事件」等,由於詞庫中可能不包含「李剛事件」這個詞條,但是可能包含「李剛」與「事件」之間的二元關係,因此,還可以為「李剛」與「事件」之間的二元關係設置新的強度值,作為需要更新的信息保存在更新文件中。另外,輸入法詞庫中也可能不包含「李剛」與「事件」之間的二元關係,但是分別存在「李剛」及「事件」這兩個詞條,此時,還可以將新增「李剛」與「事件」之間的二元關係作為需要更新的信息保存在更新文件中,同時,還可以為該新增的二元關係設置較高的二元關係強度值。通過以上熱詞更新信息,就使得隨著熱詞的出現時間而改變輸入法詞庫中已有詞條的詞頻和/或多元關係成為可能,進而改變熱詞在候選項中出現的位置。如前文所述,熱詞通常具有階段性使用頻度升高的特點,也就是說,熱詞通常具有有效期,在該有效期之內可能是熱詞,過了該有效期,就不再是熱詞了。對於這種階段性的熱詞,在本發明實施例的一種實現方式中,可以在獲取熱詞更新信息的同時,獲取熱詞的有效時間,也就是說,可以將有效時間作為更新文件中的一個參數,一起提供給客戶端。客戶端在執行了更新的同時開始計時,當達到該有效時間後,就可以將之前更新過的屬性恢復到更新前的狀態。具體的,包括將詞條的詞頻降為原來的值, 將多元關係強度降為原來的值,或者刪除增加的多元關係等等。可見,通過這種方式,可以很方便地調整輸入法詞庫中已有信息的屬性,使得輸入法詞庫中的詞條或多元關係能夠呈現出與時事相關的暫時性提高,之後又回落到原來的狀態。例如,在當前的輸入法詞庫,編碼字符串「yangshi」對應的默認首選項是「樣式」;但是,當出現央視大火這一時事時,通過本發明實施例,就可以將「央視」的詞頻暫時提高,這樣,就可以使得「央視」暫時成為「yangshi」的首選項。過了一個月之後,該事件逐漸淡出了人們的視線,因此,又可以將「央視」恢復到原來的詞頻。顯然,這可以進一步提高輸入法詞庫的質量,提升用戶的輸入速度。對於這種階段性的熱詞,在本發明實施例的另一種實現方式下,伺服器端可以在一定時期後再次修改已經過時的熱詞的詞頻,或者與其他詞條之間的多元關係(包括修改多元關係的強度、刪除多元關係等等),同樣將這些信息製作成更新文件,客戶端在下載到該更新文件之後,依據更新文件中的具體數據,重新對詞條詞頻、多元關係等進行修改即可。實施方式二在前述實施方式一中,在更改詞條屬性時,是通過改變詞條的詞頻、詞條之間的多元關係(包括改變多元關係的強度、新增或刪除多元關係)等方式來進行的,而在實施方式二中,還可以通過為詞條或者詞條之間的多元關係增加熱詞標籤的方式,來實現對詞條屬性的更改,對於客戶端而言,只要約定在展現候選項時優先展現帶有熱詞標籤的詞條、或者帶有熱詞標籤多元關係的組詞詞條即可。此時,在生成熱詞更新信息時,可以不必在熱詞更新信息中指明更新後的詞頻或強度值,而是直接在熱詞更新信息中通過熱詞標籤直接指明其為熱詞即可。也就是說,在這種方式下,伺服器在獲知熱詞之後,可以為相應的詞條或多元關係增加熱詞標籤,並據此製作成更新文件。此時,客戶端在下載得到伺服器端的更新文件之後,就可以根據更新文件中的熱詞標籤,為客戶端詞庫中對應的詞條或者詞條之間的多元關係打上熱詞標籤,或者在客戶端詞庫中增加詞條之間的帶有熱詞標籤的多元關係等等,這樣,客戶端就可以在展現候選項時,優先展現帶有熱詞標籤的詞條或者根據帶有熱詞標籤的二元關係生成的詞條。
例如,仍以伺服器收集到某熱詞「李剛」為例,則需要更新的信息可以包括「李剛」這個詞條,同時,與該熱詞相關的可能還有「李剛事件」等,這樣,在製作更新文件時,就可以為「李剛」這一詞條打上熱詞標籤,並為「李剛」與「事件」之間的二元關係打上熱詞標籤,並將這些信息作為需要更新的信息保存在更新文件中。這樣,客戶端在下載到該更新文件之後,就可以與客戶端詞庫中的詞條以及二元關係進行比對,並將對應的「李剛」這一詞條打上熱詞標籤,將「李剛」與「事件」之間的二元關係打上熱詞標籤;當然,客戶端詞庫中可能還不存在「李剛」與「事件」之間的二元關係,則,可以首先增加「李剛」與「事件」之間的二元關係,然後再為其打上熱詞標籤。這樣,當用戶輸入「ligang」時,就可以將帶有熱詞標籤的詞條「李剛」優先展現,或者,當用戶輸入「ligangshijian」時,就可以將依據帶有熱詞標籤的二元關係(「李剛」與「事件」)生成的詞條「李剛事件」優先展現。與實施方式一類似,同樣可以為這種更新文件設置版本號,以便只有當客戶端發現伺服器端出現新版本的更新文件時再進行下載,以避免造成傳輸等資源的浪費。另外,對於階段性的熱詞,在一種方式下,伺服器端可以在一定時期後將去掉詞條 或者多元關係的熱詞標籤的更新信息製作成更新文件,客戶端在下載到該更新文件之後,依據更新文件,將客戶端詞庫中相應詞條的熱詞標籤、多元關係的熱詞標籤去掉,或者將多元關係刪除即可。或者,在另一種方式下,有效時間同樣可以作為更新文件中的一個參數,一起提供給客戶端,客戶端在執行了更新的同時開始計時,到達該有效時間之後就可以執行恢復的操作,去掉相應詞條的熱詞標籤、多元關係的熱詞標籤、或者刪除多元關係。實施方式三在前述實施方式一以及實施方式二中,都是由伺服器端收集熱詞,並製作相應的更新文件,由客戶端進行下載以及詞條屬性的更新。而在實施方式三中,對於一些特殊的熱詞,也可以在客戶端設置熱詞相關信息,此時,相當於是在客戶端的輸入法詞庫中為可能成為熱詞的詞條或者多元關係增加一條屬性,以表明在何種條件下,將該詞條作為熱詞處理,據此,客戶端就可以直接在本地獲取熱詞更新信息。這種特殊的熱詞通常是指一些有規律的按時間出現的熱詞。如,一些與節日相關的熱詞等。對於這類詞條,就可以直接在輸入法詞庫中為其增加一條屬性,以表明何時將其作為熱詞來處理。例如,由於每年的「五一」、「端午」、「新年」等節日期間,一些與旅遊、出行、購物等相關的詞條都可能成為熱詞,因此,就可以預先為這些詞條設置熱詞觸發條件,具體的條件與節日的實際時間相關。這樣,對於客戶端而言,一旦發現當前的時間滿足某詞條的熱詞觸發條件,就可以將其作為熱詞進行處理。具體的處理可以參照前述實施例,例如可以包括提高詞頻或多元關係強度,新增多元關係,或者加上熱詞標籤等等。其中,為了便於確定更新後的詞頻或多元關係強度的具體取值,可以預先設置詞條作為熱詞之後的詞頻或者多元關係強度,客戶端可以據此進行更新。為了體現熱詞的階段性,在實施方式三中,還可以在輸入法詞庫中為詞條增加另一條屬性(為便於描述,下面將該屬性稱為「第二屬性」,前述用於表明何種條件下將詞條作為熱詞處理的屬性稱為「第一屬性」),以此來體現出詞條或二元關係作為熱詞的有效時間。這樣,客戶端就可以在依據詞條的第一屬性將其作為熱詞處理的同時開始計時,當通過第二屬性體現出的有效時間到時時,就可以將詞條的詞頻、多元關係等復原,或者將熱詞標籤刪除。
總之,在本發明實施例中,可以實現將輸入法詞庫中已有信息的屬性進行與時事相關的更新,從而提高輸入法詞庫的質量,提高輸入速度。其中,在對已有信息的屬性進行更新時,可以改變已有詞條的詞頻,或者改變已有多元關係的強度,或者為已有詞條或多元關係增加熱詞標籤,或者增加新的多元關係、刪除已有的多元關係,等等。與本發明實施例提供的更新輸入法詞庫的方法相對應,本發明實施例還提供了一種更新輸入法詞庫的系統,參見圖2,該系統包括詞條更新信息獲取單元201,用於獲取詞條更新信息;更新單元202,用於根據所述詞條更新信息對輸入法詞庫中已有詞條的屬性進行更新;候選項提供單元203,用於依據更新後的詞條屬性提供候選項。其中,所述詞條更新信息可以包括至少一個已有詞條的詞頻和/或多元關係的更新指示;更新單元202包括第一更新子單元,用於對輸入法詞庫中已有詞條的詞頻和/或多元關係進行更新。其中,所述第一更新子單元對已有詞條的多元關係進行更新包括修改已有多元關係的強度、增加詞條之間新的多元關係、或刪除詞條之間已有的多元關係。在實際應用中,所述詞條更新信息也可以包括至少一個已有詞條的熱詞標籤更新指示;此時,更新單元202可以包括第二更新子單元,用於為輸入法詞庫中的已有詞條或已有詞條的多元關係添加熱詞標籤;候選項提供單元203具體用於在展現候選項時,將帶有熱詞標籤的詞條或多元關係進行優先展現。另外,更新單元還可以包括第三更新子單元,用於為輸入法詞庫中的已有詞條或已有詞條的多元關係刪除熱詞標籤。由於通常是針對可能成為熱詞的詞條進行屬性的更新,同時熱詞通常又具有階段性的特點,因此,該系統還可以包括有效時間獲取單元,用於獲取所述詞條更新信息的有效時間;屬性恢復單元,用於當到達所述有效時間時,將所述輸入法詞庫中已有詞條的屬性恢復到更新前的狀態。具體在獲取詞條更新信息時,可以有多種途徑,例如可以從伺服器獲取,還可以預先在本地輸入法詞庫中預置,並從本地輸入法詞庫中獲取,等等。其中,當從伺服器獲取時,詞條更新信息獲取單元201可以包括第一獲取子單元,用於從伺服器接收所述詞條更新信息。當從本地輸入法詞庫中獲取時,詞條更新信息獲取單元包括第二獲取子單元,用於從預置的熱詞相關信息中,獲取所述詞條更新信息;所述熱詞相關信息包括已有詞條的屬性更新指示及觸發條件;
相應的,更新單元202具體可以用於在滿足所述觸發條件時,根據所述更新指示對已有詞條的屬性進行更新。通過本發明實施例提供的上述更新輸入法詞庫的系統,可以將輸入法詞庫中已有詞條的屬性進行與時事相關的更新,進而改變候選項的展現,這樣,針對熱詞也能夠實現較短的更新周期,從而提高輸入法詞庫的質量,提高輸入速度。需要說明的是,以上所述更新輸入法詞庫的系統是與前述更新輸入法詞庫的方法相對應的,因此,系統實施例中未詳述部分可以參見方法實施例中的介紹,這裡不再贅述。以上對本發明所提供的一種更新輸入法詞庫的方法及系統,進行了詳細介紹,本文中應用了具體個例對本發明的原理及實施方式進行了闡述,以上實施例的說明只是用於幫助理解本發明的方法及其核心思想;同時,對於本領域的一般技術人員,依據本發明的思 想,在具體實施方式
及應用範圍上均會有改變之處。綜上所述,本說明書內容不應理解為對本發明的限制。
權利要求
1.一種更新輸入法詞庫的方法,其特徵在於,包括 獲取詞條更新信息; 根據所述詞條更新信息對輸入法詞庫中已有詞條的屬性進行更新; 依據更新後的詞條屬性提供候選項。
2.根據權利要求I所述的方法,其特徵在於,所述詞條更新信息包括至少一個已有詞條的詞頻和/或多元關係的更新指示; 所述根據詞條更新信息對輸入法詞庫中已有詞條的屬性進行更新包括對輸入法詞庫中已有詞條的詞頻和/或多元關係進行更新。
3.根據權利要求2所述的方法,其特徵在於,所述對已有詞條的多元關係進行更新包括修改已有多元關係的強度、增加詞條之間新的多元關係、或刪除詞條之間已有的多元關 系O
4.根據權利要求I所述的方法,其特徵在於,所述詞條更新信息包括至少一個已有詞條的熱詞標籤更新指示; 所述根據詞條更新信息對輸入法詞庫中已有詞條的屬性進行更新包括為輸入法詞庫中的已有詞條或已有詞條的多元關係添加熱詞標籤; 所述依據更新後的詞條屬性提供候選項包括在展現候選項時,將帶有熱詞標籤的詞條或多元關係進行優先展現。
5.根據權利要求4所述的方法,其特徵在於,所述根據詞條更新信息對輸入法詞庫中已有詞條的屬性進行更新包括為輸入法詞庫中的已有詞條或已有詞條的多元關係刪除熱詞標籤。
6.根據權利要求I所述的方法,其特徵在於,還包括 獲取所述詞條更新信息的有效時間; 當到達所述有效時間時,將所述輸入法詞庫中已有詞條的屬性恢復到更新前的狀態。
7.根據權利要求I至6任一項所述的方法,其特徵在於,所述獲取詞條更新信息包括從伺服器接收所述詞條更新信息。
8.根據權利要求I至6任一項所述的方法,其特徵在於,所述獲取詞條更新信息包括從預置的熱詞相關信息中,獲取所述詞條更新信息;所述熱詞相關信息包括已有詞條的屬性更新指示及觸發條件; 所述根據詞條更新信息對輸入法詞庫中已有詞條的屬性進行更新包括在滿足所述觸發條件時,根據所述更新指示對已有詞條的屬性進行更新。
9.一種更新輸入法詞庫的系統,其特徵在於,包括 詞條更新信息獲取單元,用於獲取詞條更新信息; 更新單元,用於根據所述詞條更新信息對輸入法詞庫中已有詞條的屬性進行更新; 候選項提供單元,用於依據更新後的詞條屬性提供候選項。
10.根據權利要求9所述的系統,其特徵在於,所述詞條更新信息包括至少一個已有詞條的詞頻和/或多元關係的更新指示; 所述更新單元包括 第一更新子單元,用於對輸入法詞庫中已有詞條的詞頻和/或多元關係進行更新。
11.根據權利要求10所述的系統,其特徵在於,所述第一更新子單元對已有詞條的多元關係進行更新包括修改已有多元關係的強度、增加詞條之間新的多元關係、或刪除詞條之間已有的多元關係。
12.根據權利要求9所述的系統,其特徵在於,所述詞條更新信息包括至少一個已有詞條的熱詞標籤更新指示; 所述更新單元包括 第二更新子單元,用於為輸入法詞庫中的已有詞條或已有詞條的多元關係添加熱詞標籤; 所述候選項提供單元具體用於在展現候選項時,將帶有熱詞標籤的詞條或多元關係進行優先展現。
13.根據權利要求12所述的系統,其特徵在於,所述更新單元包括 第三更新子單元,用於為輸入法詞庫中的已有詞條或已有詞條的多元關係刪除熱詞標籤。
14.根據權利要求9所述的系統,其特徵在於,還包括 有效時間獲取單元,用於獲取所述詞條更新信息的有效時間; 屬性恢復單元,用於當到達所述有效時間時,將所述輸入法詞庫中已有詞條的屬性恢復到更新前的狀態。
15.根據權利要求9至14任一項所述的系統,其特徵在於,所述詞條更新信息獲取單元包括 第一獲取子單元,用於從伺服器接收所述詞條更新信息。
16.根據權利要求9至14任一項所述的系統,其特徵在於,所述詞條更新信息獲取單元包括 第二獲取子單元,用於從預置的熱詞相關信息中,獲取所述詞條更新信息;所述熱詞相關信息包括已有詞條的屬性更新指示及觸發條件; 所述更新單元具體用於在滿足所述觸發條件時,根據所述更新指示對已有詞條的屬性進行更新。
全文摘要
本發明公開了一種更新輸入法詞庫的方法及系統,其中,所述方法包括獲取詞條更新信息;根據所述詞條更新信息對輸入法詞庫中已有詞條的屬性進行更新;依據更新後的詞條屬性提供候選項。通過本發明,能夠針對熱詞實現較短的詞庫更新周期,有利於提高輸入法系統的性能。
文檔編號G06F3/023GK102955825SQ20111025350
公開日2013年3月6日 申請日期2011年8月30日 優先權日2011年8月30日
發明者查文 申請人:北京搜狗科技發展有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀