新四季網

一種用於確定同義文本的方法和裝置的製作方法

2023-07-06 13:32:06 1

專利名稱:一種用於確定同義文本的方法和裝置的製作方法
技術領域:
本發明涉及計算機技術領域,尤其涉及一種用於確定同義文本的方法和裝置。
背景技術:
當用戶在網際網路上進行搜索時,很有可能會採用不同名稱來表達同一個搜索對象;例如,對於應用「where is my water」,用戶在搜索時可能採用「鱷魚愛洗澡」、「鱷魚愛衝涼」、「鱷魚小頑皮」等名稱來對其進行搜索;又例如,用戶所搜索的「掌上百度」和「掌百」 可能為同一搜索對象等。因此,搜索技術中需要識別這些名稱不同,但表示同一搜索對象的文本序列。
現有技術中存在的識別表示同一搜索對象的文本序列的方式包括
I)由人工進行識別和標記;
2)通過語義上的同義詞識別,如識別出「洗澡」和「衝涼」為語義上的同義詞等,來識別表示同一搜索對象的文本序列。
然而,人工識別和標記的方式滯後性大、且能夠識別的搜索對象有限,人工成本也較高;語義識別的識別率低,例如,對於一些語義上差別極大,但仍表示同一搜索對象的文本序列,則無法識別;並且,上述兩種方式均具有覆蓋面低的問題。發明內容
本發明的目的是提供一種用於確定同義文本的方法和裝置。
根據本發明的一個方面,提供了一種用於建立或更新候選同義序列庫的方法,其中,該方法包括以下步驟
A將待處理的文本序列的第一搜索結果與其待挖掘序列的第二搜索結果進行匹配;
其中,該方法還包括以下步驟
X當所述匹配的結果符合第一預定條件時,根據所述待挖掘序列建立或更新所述待處理的文本序列的候選同義序列庫;
其中,所述第一預定條件包括所述第一搜索結果與所述第二搜索結果包含至少一個相同的搜索結果項。
根據本發明的另一個方面,還提供了一種用於確定同義文本的方法,其中,該方法包括以下步驟
a對待處理的文本序列進行切詞,獲得至少一個文本片段;
b根據所述至少一個文本片段,在所述文本序列的候選同義序列庫中進行查詢,獲得包含所述至少一個文本片段或其同義詞中的一個或多個的候選同義序列,作為所述文本序列的候選同義文本,其中,基於所述文本序列所得的歷史搜索結果與基於所述候選同義序列所得的歷史搜索結果的匹配結果符合第一預定條件;
c從所述候選同義文本中選擇所述文本序列的同義文本;6
其中,所述第一預定條件包括所述第一搜索結果與所述第二搜索結果包含至少一個相同的搜索結果項。
根據本發明的另一個方面,還提供了一種用於建立或更新候選同義序列庫的更新裝置,其中,該更新裝置包括
匹配裝置,用於將待處理的文本序列的第一搜索結果與其待挖掘序列的第二搜索結果進行匹配;
庫更新裝置,用於當所述匹配的結果符合第一預定條件時,根據所述待挖掘序列建立或更新所述待處理的文本序列的候選同義序列庫;
其中,所述第一預定條件包括所述第一搜索結果與所述第二搜索結果包含至少一個相同的搜索結果項。
根據本發明的另一個方面,還提供了一種用於確定同義文本的同義文本確定裝置,其中,該同義文本確定裝置包括
切詞裝置,用於對待處理的文本序列進行切詞,獲得至少一個文本片段;
查詢裝置,用於根據所述至少一個文本片段,在所述文本序列的候選同義序列庫中進行查詢,獲得包含所述至少一個文本片段或其同義詞中的一個或多個的候選同義序列,作為所述文本序列的候選同義文本,其中,基於所述文本序列所得的歷史搜索結果與基於所述候選同義序列所得的歷史搜索結果的匹配結果符合第一預定條件;
第一選擇裝置,用於從所述候選同義文本中選擇所述文本序列的同義文本;
其中,所述第一預定條件包括所述第一搜索結果與所述第二搜索結果包含至少一個相同的搜索結果項。
與現有技術相比,本發明具有以下優點1)能夠獲取在各自的搜索結果中均被用戶點擊的搜索結果項來建立關聯的待處理文本序列及其候選同義序列,並進一步通過多種方式判斷各個候選同義序列是否的確為待處理的文本序列的同義文本,從而能夠獲得現有技術中難以召回的待處理文本序列的同義詞,並能較好地提高待處理文本序列的同義詞判斷準確性;2)能夠對待處理的文本序列及其同義文本進行整理,確保兩者的統一性;3)通過基於所請求搜索的文本序列及其同義文本進行搜索,能夠獲得單純基於文本序列進行搜索難以獲得且實際可能為用戶所需的搜索結果項;4)由於若一個搜索結果項出現在兩個文本序列的搜索結果中,則可認為儘管用戶輸入了不同的文本序列,但其希望搜索的對象是相同或相似的,本發明據此來挖掘一個文本序列的候選同義序列,能夠獲得基於現有技術的方案難以召回的候選同義序列;5)更進一步的,若一個搜索結果項不僅出現在兩個文本序列的搜索結果中,還均被用戶點擊,則可認為用戶可能認為該兩個文本序列是相同或相似的,本發明據此進一步來挖掘一個文本序列的候選同義序列,能夠獲得基於現有技術的方案難以召回的候選同義序列;6)由於在兩個搜索結果中均被用戶點擊的次數、頻率等越高,其且均被用戶點擊的搜索結果項的數量越多,則用戶認為該兩個搜索結果項指向同一搜索對象的可能性越大,據此,本優選方案還能夠基於均被用戶點擊的搜索結果項的點擊信息,進一步篩選候選同義序列。


通過閱讀參照以下附圖所作的對非限制性實施例所作的詳細描述,本發明的其它特徵、目的和優點將會變得更明顯
圖I為本發明一個優選實施例的用於確定同義文本的方法流程圖2為本發明一個優選實施例的用於建立或更新候選同義序列庫的方法流程圖3為本發明一個優選實施例的用於確定同義文本的確定裝置的結構示意圖4為本發明一個優選實施例的用於建立或更新候選同義序列庫的更新裝置的結構示意圖。
附圖中相同或相似的附圖標記代表相同或相似的部件。
具體實施方式
下面結合附圖對本發明作進一步詳細描述。
圖I為本發明一個優選實施例的用於確定同義文本的方法流程圖。根據本實施例的方法包括步驟SI、步驟S2和步驟S3。其中,本實施例的方法主要通過計算機設備來實現; 所述計算機設備包括但不限於網絡設備或用戶設備;所述網絡設備包括但不限於單個網絡伺服器、多個網絡伺服器組成的伺服器組或基於雲計算(Cloud Computing)的由大量計算機或網絡伺服器構成的雲,其中,雲計算是分布式計算的一種,由一群鬆散耦合的計算機集組成的一個超級虛擬計算機;所述用戶設備包括但不限於PC機、平板電腦等;所述計算機設備所處的網絡包括但不限於網際網路、廣域網、城域網、區域網、VPN網絡等。
需要說明的是,所述計算機設備和網絡僅為舉例,其他現有的或今後可能出現的計算設備或網絡如可適用於本發明,也應包含在本發明保護範圍以內,並以引用方式包含於此。
在步驟SI中,計算機設備對待處理的文本序列進行切詞,獲得至少一個文本片段。
其中,所述待處理的文本序列包括任何需要確定其同義文本的文本序列;優選地, 所述待處理的文本序列包括網絡資源名稱,該網絡資源名稱包括網絡中能夠獲得的任何資源的名稱,如應用名稱、音視頻名稱等;更優選地,所述待處理的文本序列包括應用名稱。
其中,計算機設備獲得待處理的文本序列的方式包括但不限於
I)計算機設備獲取已預存儲的待處理的文本序列;如已預存儲在計算機設備或其他設備中的文本序列等;
2)計算機設備實時獲取來自用戶的搜索序列,作為待處理的文本序列等。
其中,計算機設備可採用多種方式來對待處理的文本序列進行切詞,獲得其至少一個文本片段。
例如,計算機設備根據詞典,對待處理的文本序列「小頑皮愛衝涼」進行切詞,獲得該待處理的文本序列的3個文本片段「小頑皮」、「愛」以及「衝涼」。
需要說明的是,上述舉例僅為更好地說明本發明的技術方案,而非對本發明的限制,本領域技術人員應該理解,任何對待處理的文本序列進行切詞,獲得至少一個文本片段的實現方式,均應包含在本發明的範圍內。
接著,在步驟S2中,計算機設備根據切詞所得的至少一個文本片段,在待處理的文本序列的候選同義序列庫中進行查詢,獲得包含所述至少一個文本片段或其同義詞中的一個或多個的候選同義序列,作為待處理的文本序列的候選同義文本。
其中,基於文本序列所得的第一搜索結果與基於候選同義序列所得的第二搜索結果的匹配結果符合第一預定條件,該第一預定條件包括所述第一搜索結果與所述第二搜索結果包含至少一個相同的搜索結果項。優選地,該第一預定條件還可包括其他條件,並將在參照圖2所示實施例中予以詳述,在此不予贅述。
其中,所述搜索結果項可包含任何搜索結果信息,例如,搜索結果連結、搜索結果摘要等。
其中,待處理的文本序列的候選同義序列庫可在步驟S2執行之前預確定;該預確定候選同義文本序列庫的方式將在參照圖2所示實施例中予以詳述,在此不予贅述。
其中,計算機設備可採用多種方式確定一個文本片段的同義詞;例如,通過查詢預定同義詞詞典來確定一個文本片段的一個或多個同義詞;又例如,通過查詢預定同義詞詞詞典,並結合語義分析來確定一個文本片段的一個或多個同義詞等。
具體地,計算機設備根據切詞所得的至少一個文本片段,在待處理的文本序列的候選同義序列庫中進行查詢,獲得包含所述至少一個文本片段或其同義詞中的一個或多個的候選同義序列,作為待處理的文本序列的候選同義文本的方式包括但不限於
I)當計算機設備查詢並確定一個候選同義序列包含切詞所得的至少一個文本片段或該至少一個文本片段中一個或多個文本片段的同義詞時,確定該候選同義序列為待處理的文本序列的候選同義文本。
例如,待處理的文本序列「鱷魚愛衝涼」的文本片段包括「鱷魚」、「愛」和「衝涼」, 候選同義序列包括「小頑皮愛洗澡」、「鱷魚愛洗澡」、「小頑皮洗澡」、「洗了麼」、「洗得如何」; 則計算機設備在文本序列「鱷魚愛洗澡」的候選同義序列庫中進行查詢,並確定「小頑皮愛洗澡」包括文本片段「愛」以及「衝涼」的同義詞「洗澡」,候選同義序列「鱷魚愛洗澡」包括文本片段「鱷魚」和「愛」以及「衝涼」的同義詞「洗澡」,候選同義序列「小頑皮洗澡」包括文本片段「衝涼」的同義詞「洗澡」,則將候選同義序列「小頑皮愛洗澡」、「鱷魚愛洗澡」和「小頑皮洗澡」作為待處理的文本序列「鱷魚愛衝涼」的候選同義文本。
2)計算機設備獲取切詞所得的至少一個文本片段的同義詞;並在所述文本序列的候選同義序列庫中進行查詢,以獲得包含所述同義詞的候選同義序列;並且,當所述查詢所獲得的候選同義序列僅包含所述同義詞時,直接將所述查詢到的候選同義序列作為所述候選同義文本;當所述查詢所獲得的候選同義序列包含所述同義詞以及其他文本信息時, 將所包含的其他文本信息與待處理的文本序列部分相同的候選同義序列,作為所述候選同義文本。
例如,待處理的文本序列「鱷魚愛衝涼」的文本片段包括「鱷魚」、「愛」和「衝涼」,候選同義序列庫包括「小頑皮愛洗澡」、「鱷魚愛洗澡」、「小頑皮洗澡」、「洗了麼」、「洗得如何」。
計算機設備在待處理的文本序列「鱷魚愛衝涼」的候選同義序列庫中查詢到候選同義序列「小頑皮愛洗澡」包含文本片段「衝涼」的同義詞「洗澡」,且計算機設備判斷候選同義序列「小頑皮愛洗澡」中的其他文本信息「小頑皮愛」與待處理的文本序列「鱷魚愛衝涼」中存在部分相同的文本信息「愛」,則計算機設備確定候選同義序列「小頑皮愛洗澡」為待處理的文本序列「鱷魚愛衝涼」的候選同義文本。
接著,類似地,計算機設備繼續在候選同義序列中進行查詢,確定候選同義序列 「小頑皮愛洗澡」、「鱷魚愛洗澡」和「小頑皮洗澡」為待處理的文本序列「鱷魚愛衝涼」的候選同義文本。
需要說明的是,上述舉例僅為更好地說明本發明的技術方案,而非對本發明的限制,本領域技術人員應該理解,任何獲取切詞所得的至少一個文本片段的同義詞,並在所述文本序列的候選同義序列庫中進行查詢,以獲得包含所述同義詞的候選同義序列,並且,當所述查詢所獲得的候選同義序列僅包含所述同義詞時,直接將所述查詢到的候選同義序列作為所述候選同義文本,當所述查詢所獲得的候選同義序列包含所述同義詞以及其他文本信息時,將所包含的其他文本信息與待處理的文本序列部分相同的候選同義序列,作為所述候選同義文本的實現方式;例如,當查詢所獲得的候選同義序列包含同義詞以及其他文本信息時,僅當所包含的其他文本信息與待處理的文本序列中除該候選同義序列包含的同義詞所對應的文本片段以外的文本片段全部或部分相同時,才將該候選同義序列,作為所述候選同義文本等,均應包含在本發明的範圍內。
需要進一步說明的是,本領域技術人員應能理解,在步驟S2所限定的方式下,計算機設備可採用多種方式從候選同義序列庫中選出候選同義文本。例如,計算機設備可先查詢並確定所有包含文本片段的同義詞的候選文本序列,再從中選擇候選同義文本;或者, 計算機設備也可逐一判斷各個候選文本序列是否為候選同義文本。
接著,在步驟S3中,計算機設備從候選同義文本中選擇待處理的文本序列的同義文本。
具體地,計算機設備從所述候選同義文本中選擇所述文本序列的同義文本的方式包括但不限於
I)計算機設備根據候選同義文本與待處理的文本序列之間的關聯度,從候選同義文本中選擇同義文本。其中,候選同義文本與待處理的文本序列之間的關聯度越高,則候選同義文本被選擇為同義文本的可能性越高。
其中,該關聯度可基於多種因素確定,例如,基於在候選同義文本的搜索結果和待處理的文本序列的第一搜索結果中均被用戶點擊的搜索結果項的點擊信息來確定,其中, 搜索結果項的點擊信息包括但不限於搜索結果項的點擊率、點擊次數、被點擊時間、點擊頻率等;優選地,點擊率、點擊次數、點擊頻率等越高,則關聯度越高。優選地,關聯度還可基於候選同義文本包含的文本片段的同義詞與待處理的文本序列之間的預確定的接近程度,候選同義文本包含的同義詞在該候選同義文本中所佔的比例等來確定。
2)待處理的文本序列包括網絡資源名稱,計算機設備通過對候選同義文本的全部或部分候選同義文本中的每一個執行以下操作A和B中的至少一項,來從所述候選同義文本中選擇所述文本序列的同義文本;其中,計算機設備可對候選同義文本中的每一項均執行以下操作A和/或B,或者,計算機設備可按照候選同義文本與待處理的文本序列之間的關聯度由高至低的順序,或者,按照基於諸如關聯度、預確定的重要度等參數確定的權值由高至低的順序,逐一對各個候選同義文本執行以下操作,直至獲得預定數量(如30個)或已對所有優選同義文本執行完下述操作A和/或B為止。
以下將對操作A和B進行說明
操作A :判斷待處理的文本序列以及當前處理的候選同義文本是否具有非同義特徵。
其中,所述非同義特徵包括任何能夠體現待處理的文本序列以及候選同義文本並非同義詞的特徵信息。優選地,該非同義特徵包括但不限於以下至少一項
I)待處理的文本序列所對應的網絡資源與候選同義文本所對應的網絡資源屬於不同品牌。
例如,屬於不同品牌的應用,如屬於QQ的QQ手機助理和屬於360的360手機助手坐寸ο
又例如,屬於不同品牌的影視作品等。
優選地,計算機設備可通過識別待處理的文本序列與候選同義文本中具有品牌特徵的文本信息,如QQ、360等,或者,獲取計算機設備或其他設備已預確定的、待處理的文本序列與候選同義文本的品牌信息,來確定待處理的文本序列所對應的網絡資源與候選同義文本所對應的網絡資源是否屬於不同品牌。
2)候選同義文本包含預定資源衍生詞彙;其中,該預定資源衍生詞彙包括與網絡資源相關但並非網絡資源本身的詞彙。
例如,與應用遊戲相關但不屬於應用遊戲本身的遊戲攻略、地圖、修改器;又例如, 與影視作品相關但不屬於影視作品的影評等。
3)所述候選同義文本包含預定資源片段特徵;其中,該預定資源片段特徵包括屬於資源的一個特定部分,而非形容資源整體的特徵。
例如,遊戲中的特定場景名稱;又例如,影視作品的剪輯名稱等。
4)待處理的文本序列與所述候選同義文本中的一者為另一者的具體實例。
例如,精確的應用名稱為泛用應用的具體實例,如「安兔兔跑分軟體」為「跑分軟體」的具體實例等。
優選地,計算機設備可通過識別待處理的文本序列與所述候選同義文本中的一者所屬分類是否為另一者的子分類,或者,識別一者是否為另一者的預定具體實例,或者, 獲取計算機設備或其他設備已預確定的、待處理的文本序列與候選同義文本的具體實例信息,來確定待處理的文本序列與所述候選同義文本中的一者為另一者的具體實例。
5)待處理的文本序列以及所述候選同義文本中存在至少兩種語言的文本信息,且將其中一種語言翻譯為另一種語言所得的翻譯結果在該另一種語言的文本信息中不存在同義詞,也即,待處理的文本序列以及候選同義文本中一者的全部或部分文本信息從一種語言翻譯為另一種語言後,在另一者中不存在對應的同義詞。
例如,待處理的文本序列「sd card清理工具」以及候選同義文本「磁碟清理工具」 中存在英文與中文兩種語言的文本信息,且待處理的文本序列「sd card清理工具」中的文本片段英文「sd card」經翻譯後所得的中文「安全數碼卡」在候選同義文本「磁碟清理工具」中不存在對應的同義詞等。
需要說明的是,上述非同義特徵的舉例僅為更好地說明本發明的技術方案,而非對本發明的限制,本領域技術人員應該理解,任何能夠體現待處理的文本序列以及候選同義文本並非同義詞的特徵信息,均應包含在本發明的範圍內。
具體地,當判斷判斷待處理的文本序列以及當前處理的候選同義文本具有非同義特徵時,計算機設備不將當前處理的候選同義文本作為待處理的文本序列的同義文本。
例如,計算機設備不將與「360手機助手」屬於不同品牌「QQ手機助理」作為「QQ手機助理」的同義文本;又例如,計算機設備不將文本序列「跑分軟體」的具體實例的候選同義文本「安兔兔跑分軟體」作為其同義文本等。
需要說明的是,上述舉例僅為更好地說明本發明的技術方案,而非對本發明的限制,本領域技術人員應該理解,任何當判斷判斷待處理的文本序列以及當前處理的候選同義文本具有非同義特徵時,不將當前處理的候選同義文本作為待處理的文本序列的同義文本的實現方式,均應包含在本發明的範圍內。
操作B :判斷當前處理的候選同義文本是否存在相應的網絡資源。
其中,當判斷存在相應的網絡資源時,第二子選擇裝置將當前處理的候選同義文本選擇為待處理的文本序列的同義文本。
具體地,計算機設備判斷當前處理的候選同義文本是否存在相應的網絡資源的方式包括但不限於
I)計算機設備獲取已預確定的、候選同義文本的網絡資源判斷結果,以判斷當前處理的候選同義文本是否存在相應的網絡資源。
例如,計算機設備獲取其或其他設備在本步驟S3執行之前已預確定的、候選同義文本「鱷魚愛洗澡」在網絡中是否存在網絡資源的網絡資源判斷結果,判斷「鱷魚愛洗澡」是否存在相應的網絡資源。
其中,預確定候選同義文本的網絡資源判斷結果的方式,與下述實現方式2)中計算機設備實時判斷當前處理的候選同義文本是否存在相應的網絡資源的方式相同或相似, 在此不再贅述。
2)計算機設備在步驟S3中實時判斷當前處理的候選同義文本是否存在相應的網絡資源。
優選地,計算機設備實時判斷當前處理的候選同義文本是否存在相應的網絡資源的方式包括但不限於
i)計算機設備基於當前處理的候選同義文本,在預定網絡資源站點中進行資源搜索,並根據是否能夠獲得資源搜索結果,來判斷所述當前處理的候選同義文本在所述預定網絡資源站點中是否存在相應的網絡資源。
例如,預定網絡資源站點包括安卓(Android)站點,當前處理的候選同義文本包括「鱷魚愛洗 澡」,計算機設備在安卓站點中基於「鱷魚愛洗澡」進行搜索,並根據是否能夠獲得資源搜索結果,來判斷「鱷魚愛洗澡」在安卓站點中是否存在相應的網絡資源。
ii)計算機設備基於當前處理的候選同義文本,進行網頁搜索,並根據是否能夠在搜索所得的網頁中提取出符合預定文本模板的文本信息,來判斷所述當前處理的候選同義文本是否存在相應的網絡資源,其中,所述預定文本模板包括所述當前處理的候選同義文本以及與其字符間隔小於預定閾值的預定詞彙。其中,預定文本模板可為一個或多個。
例如,預定文本模板包括「XXX下載」、「XXX小遊戲」以及「XXX遊戲下載」, 其中「XXX」表示當前處理的候選同義文本,預定詞彙「下載」、「小遊戲」以及「遊戲下載」與當前處理的候選同義文本之間的字符間隔小於等於I個字符;則計算機設備基於當前處理的候選同義文本「鱷魚愛洗澡」進行網頁搜索,並根據是否能夠在搜索所得的網頁中提取出符合預定文本模板「鱷魚愛洗澡下載/小遊戲/遊戲下載」的文本信息,判斷當前處理的候選同義文本「鱷魚愛洗澡」是否存在相應的網絡資源。
需要說明的是,計算機設備可基於所述當前處理的候選同義文本,在預定網絡資源站點中進行資源搜索,以及,基於所述當前處理的候選同義文本,進行網頁搜索,並根據是否能夠獲得資源搜索結果以及是否能夠在搜索所得的網頁中提取出符合預定文本模板的文本信息,判斷所述當前處理的候選同義文本是否存在相應的網絡資源。
需要說明的是,上述舉例僅為更好地說明本發明的技術方案,而非對本發明的限制,本領域技術人員應該理解,任何判斷當前處理的候選同義文本是否存在相應的網絡資源的實現方式,均應包含在本發明的範圍內。
需要說明的是,上述舉例僅為更好地說明本發明的技術方案,而非對本發明的限制,本領域技術人員應該理解,任何從候選同義文本中選擇待處理的文本序列的同義文本的實現方式,例如,從候選同義文本中隨機選擇預定數量的同義文本等,均應包含在本發明的範圍內。
本實施例中,能夠獲取在各自的搜索結果中均被用戶點擊的搜索結果項來建立關聯的待處理文本序列及其候選同義序列,並進一步通過多種方式判斷各個候選同義序列是否的確為待處理的文本序列的同義文本,從而能夠獲得現有技術中難以召回的待處理文本序列的同義詞,並能較好地提高待處理文本序列的同義詞判斷準確性。
作為本實施例的優選方案之一,待處理的文本序列包括應用名稱,本實施例的方法還包括以下步驟對於待處理的文本序列的每個同義文本,當判斷待處理的文本序列及該同義文本中僅一者包含預定應用附加特徵信息時,根據預定應用附加特徵信息,更新待處理的文本序列或該同義文本,以使待處理的文本序列以及該同義文本均包含或均不包含所述應用附加特徵信息。
其中,所述預定應用附加特徵信息包括對應用名稱進行附加限定的特徵信息;例如,表示應用版本的特徵信息1、2等;表示應用效果的特徵信息3d等;表示應用免費的特徵信息lite、free等;表示應用適用的設備的特徵信息HD等。
優選地,計算機設備根據預定應用附加特徵信息,更新文本序列或該同義文本,以使待處理的文本序列以及該同義文本均包含或均不包含所述應用附加特徵信息的方式包括但不限於
I)計算機設備在不包含預定應用附加特徵信息的一者中添加該應用附加特徵信
2)計算機設備在包含預定應用附加特徵信息的一者中刪除該預定應用附加特徵信息。
並且,對於一個待處理的文本序列和/或其所有同義文本,計算機設備僅執行上述更新方式I)或2)中的一者,以確保待處理的文本序列以及該同義文本均包含或均不包含預定應用附加特徵信息。
例如,計算機設備在步驟S3中確定待處理的文本信息「海洋世界動態桌面」的同義文本包括「3d海洋世界動態桌面」,則計算機設備判斷「海洋世界動態桌面」和「3d海洋世界動態桌面」中僅一者包含預定應用附加特徵信息,則計算機設備刪除同義文本「3d海洋世界動態桌面」中的預定應用附加特徵信息「3d」,將同義文本更新為「海洋世界動態桌面」。
需要說明的是,上述舉例僅為更好地說明本發明的技術方案,而非對本發明的限制,本領域技術人員應該理解,任何對於待處理的文本序列的每個同義文本,當判斷待處理的文本序列及該同義文本中僅一者包含預定應用附加特徵信息時,根據預定應用附加特徵13信息,更新待處理的文本序列或該同義文本,以使待處理的文本序列以及該同義文本均包含或均不包含所述應用附加特徵信息的實現方式,均應包含在本發明的範圍內。
本優選方案中,能夠對待處理的文本序列及其同義文本進行整理,確保兩者的統一性。
作為本實施例的優選方案之一,本實施例的方法還包括以下步驟計算機設備接收用戶設備所請求搜索的文本序列,基於所述文本序列及其同義文本進行搜索,並將搜索結果提供給所述用戶設備。
具體地,計算機設備接收用戶設備所請求搜索的文本序列,並基於所述文本序列及其同義文本分別進行搜索,並將基於文本序列及其同義詞分別所得的各個搜索結果項進行融合後,提供給用戶設備。
本實施例中,通過基於所請求搜索的文本序列及其同義文本進行搜索,能夠獲得單純基於文本序列進行搜索難以獲得且實際可能為用戶所需的搜索結果項。
圖2為本發明一個優選實施例的用於建立或更新候選同義序列庫的方法流程圖。 本實施例的方法包括步驟S4以及步驟S5。
在步驟S4中,計算機設備將待處理的文本序列的第一搜索結果與其待挖掘序列的第二搜索結果進行匹配。
其中,所述第一搜索結果和第二搜索結果可為分別基於待處理的文本序列和待挖掘序列進行實時搜索所得的搜索結果,也可分別為待處理的文本序列和待挖掘序列的歷史搜索結果。
其中,計算機設備可採用多種方式來將第一搜索結果與第二搜索結果進行匹配。
例如,計算機設備先獲得第一搜索結果和第二搜索結果,再將兩者進行比對。
又例如,當第一搜索結果和第二搜索結果為歷史搜索結果時,計算機設備查詢第一搜索結果包含的各個搜索結果項在其他搜索結果中出現的歷史記錄,以確定第一搜索結果中是否存在出現在第二搜索結果中的搜索結果項,從而確定第一搜索結果和第二搜索結果的匹配結果等。
需要說明的是,上述舉例僅為更好地說明本發明的技術方案,而非對本發明的限制,本領域技術人員應該理解,任何將待處理的文本序列的第一搜索結果與其待挖掘序列的第二搜索結果進行匹配的實現方式,均應包含在本發明的範圍內。
在步驟S5中,當所述匹配的結果符合第一預定條件時,計算機設備根據所述待挖掘序列建立或更新所述待處理的文本序列的候選同義序列庫;其中,所述第一預定條件包括所述第一搜索結果與所述第二搜索結果包含至少一個相同的搜索結果項。
例如,當計算機設備在步驟S4中匹配到第一搜索結果和第二搜索結果均包含搜索結果項C時,計算機設備直接將待挖掘序列作為待處理的文本序列的候選同義序列,加入其候選同義序列庫中,或對該候選同義序列進行諸如去除無意義信息等調整後,加入候選同義序列庫中。
需要說明的是,上述舉例僅為更好地說明本發明的技術方案,而非對本發明的限制,本領域技術人員應該理解,任何當所述匹配的結果符合第一預定條件時,根據所述待挖掘序列建立或更新所述待處理的文本序列的候選同義序列庫的實現方式,均應包含在本發明的範圍內。
作為本實施例的一種優選方案,第一預定條件包括所述第一搜索結果與所述第二搜索結果包含的相同的搜索結果項的數量超過第一預定閾值。例如,第一搜索結果和第二搜索結果包含相同的30個以上的搜索結果項等。
由於若一個搜索結果項出現在兩個文本序列的搜索結果中,則可認為儘管用戶輸入了不同的文本序列,但其希望搜索的對象是相同或相似的,本發明據此來挖掘一個文本序列的候選同義序列,能夠獲得基於現有技術的方案難以召回的候選同義序列。
作為本實施例的另一種優選方案,第一搜索結果與所述第二搜索結果分別為所述待處理的文本序列以及所述待挖掘序列的歷史搜索結果,前述步驟S4包括步驟S4』。
在步驟S4』中,計算機設備根據待處理的文本序列以及待挖掘序列的歷史搜索結果的用戶點擊信息,將所述第一搜索結果與所述第二搜索結果進行匹配;
其中,本實施例中,所述第一預定條件包括所述待處理的文本序列和所述待挖掘序列的歷史搜索結果中包含至少一個相同的、且均被用戶點擊的搜索結果項。
例如,基於待處理的文本序列queryl進行搜索所得的歷史搜索結果包括搜索結果項C1、C2和C3,其中,搜索結果項Cl和C2在queryl的歷史搜索結果被呈現時,被用戶點擊;基於另一文本序列query2的所得的歷史搜索結果中包括搜索結果項Cl和C2,且搜索結果項Cl在query2的搜索結果被呈現給用戶時,被用戶點擊;基於另一文本序列query3 的所得的歷史搜索結果中包括搜索結果項Cl和C3,且搜索結果項C3在query3的搜索結果被呈現給用戶時,被用戶點擊;則基於待處理的文本序列queryl所得的歷史搜索結果 (即第一搜索結果)與基於文本序列query2所得的歷史搜索結果(即第二搜索結果)中存在相同的、且在第一搜索結果和第二搜索結果中均被用戶點擊的搜索結果項Cl,文本序列query2為待處理的文本序列queryl的候選同義序列。而文本序列query3不是待處理的文本序列queryl的候選同義序列。
優選地,在上述優選方案中,第一預定條件還包括所述均被用戶點擊的搜索結果項的點擊信息符合第二預定條件。
其中,所述第二預定條件包括能夠被確定為候選同義序列的待挖掘文本序列的點擊信息所應符合的條件,如點擊率超過一預定閾值、點擊規律符合預定規律等。
例如,第二預定條件包括將在第一搜索結果和第二搜索結果中均被用戶點擊的各個搜索結果項的點擊次數相加所得的值超過預確定的閾值。
需要說明的是,優選地,第一預定條件可包括上述優選方案中的所有條件;例如, 第一預定條件可包括第一搜索結果與第二搜索結果包含的相同的、且均被用戶點擊的搜索結果項的數量超過第一預定閾值;又例如,第一預定條件可包括第一搜索結果與第二搜索結果包含的相同的、且均被用戶點擊的搜索結果項的數量超過第一預定閾值,並且,該等均被用戶點擊的搜索結果項的點擊信息符合第二預定條件等。
作為本實施例的另一種優選方案,本實施例的方法還包括以下步驟
當所述匹配結束後,計算機設備選擇另一個序列作為待處理的文本序列的待挖掘序列,重複所述步驟SI和S2,直至滿足預定停止條件,如被操作人員終止重複操作,或者, 待處理的文本序列的候選同義文本庫中包含的候選同義文本數量已達到1000等。
優選地,當通過上述方式確定的候選同義序列超過N個時,計算機設備可根據第一搜索結果與第二搜索結果的匹配程度高低,選擇排序前N位的待挖掘文本序列,作為待處理的文本序列的候選同義序列,其中,N為預定序列數量閾值。
由於若一個搜索結果項出現在兩個文本序列的搜索結果中,且均被用戶點擊,則可認為儘管用戶輸入了不同的文本序列,但其希望搜索的對象是相同或相似的。本優選方案據此來挖掘一個文本序列的候選同義序列,能夠獲得基於現有技術的方案難以召回的候選同義序列;進一步地,由於在兩個搜索結果中均被用戶點擊的次數、頻率等越高,其且均被用戶點擊的搜索結果項的數量越多,則用戶認為該兩個搜索結果項指向同一搜索對象的可能性越大,據此,本優選方案還能夠基於均被用戶點擊的搜索結果項的點擊信息,進一步篩選候選同義序列。
圖3為本發明一個優選實施例的用於確定同義文本的確定裝置的結構示意圖;本實施例的確定裝置包括切詞裝置I、查詢裝置2以及第一選擇裝置3,該確定裝置包含於計算機設備中。
切詞裝置I對待處理的文本序列進行切詞,獲得至少一個文本片段。
其中,所述待處理的文本序列包括任何需要確定其同義文本的文本序列;優選地, 所述待處理的文本序列包括網絡資源名稱,該網絡資源名稱包括網絡中能夠獲得的任何資源的名稱,如應用名稱、音視頻名稱等;更優選地,所述待處理的文本序列包括應用名稱。
其中,切詞裝置I獲得待處理的文本序列的方式包括但不限於
I)切詞裝置I獲取已預存儲的待處理的文本序列;如已預存儲在計算機設備或其他設備中的文本序列等;
2)切詞裝置I實時獲取來自用戶的搜索序列,作為待處理的文本序列等。
其中,切詞裝置I可採用多種方式來對待處理的文本序列進行切詞,獲得其至少一個文本片段。
例如,切詞裝置I根據詞典,對待處理的文本序列「小頑皮愛衝涼」進行切詞,獲得該待處理的文本序列的3個文本片段「小頑皮」、「愛」以及「衝涼」。
需要說明的是,上述舉例僅為更好地說明本發明的技術方案,而非對本發明的限制,本領域技術人員應該理解,任何對待處理的文本序列進行切詞,獲得至少一個文本片段的實現方式,均應包含在本發明的範圍內。
接著,查詢裝置2根據切詞所得的至少一個文本片段,在待處理的文本序列的候選同義序列庫中進行查詢,獲得包含所述至少一個文本片段或其同義詞中的一個或多個的候選同義序列,作為待處理的文本序列的候選同義文本。
其中,基於文本序列所得的第一搜索結果與基於候選同義序列所得的第二搜索結果的匹配結果符合第一預定條件,該第一預定條件包括所述第一搜索結果與所述第二搜索結果包含至少一個相同的搜索結果項。優選地,該第一預定條件還可包括其他條件,並將在參照圖4所示實施例中予以詳述,在此不予贅述。。
其中,所述搜索結果項可包含任何搜索結果信息,例如,搜索結果連結、搜索結果摘要等。
其中,待處理的文本序列的候選同義序列庫可在查詢裝置2執行操作之前預確定;該預確定候選同義文本序列庫的方式將在參照圖4所示實施例中予以詳述,在此不予贅述。
其中,查詢裝置2可採用多種方式確定一個文本片段的同義詞;例如,通過查詢預定同義詞詞典來確定一個文本片段的一個或多個同義詞;又例如,通過查詢預定同義詞詞詞典,並結合語義分析來確定一個文本片段的一個或多個同義詞等。
具體地,查詢裝置2根據切詞裝置I切詞所得的至少一個文本片段,在待處理的文本序列的候選同義序列庫中進行查詢,獲得包含所述至少一個文本片段或其同義詞中的一個或多個的候選同義序列,作為待處理的文本序列的候選同義文本的方式包括但不限於
I)當查詢裝置2查詢並確定一個候選同義序列包含切詞所得的至少一個文本片段或該至少一個文本片段中一個或多個文本片段的同義詞時,確定該候選同義序列為待處理的文本序列的候選同義文本。
例如,待處理的文本序列「鱷魚愛衝涼」的文本片段包括「鱷魚」、「愛」和「衝涼」, 候選同義序列包括「小頑皮愛洗澡」、「鱷魚愛洗澡」、「小頑皮洗澡」、「洗了麼」、「洗得如何」; 則查詢裝置2在文本序列「鱷魚愛洗澡」的候選同義序列庫中進行查詢,並確定「小頑皮愛洗澡」包括文本片段「愛」以及「衝涼」的同義詞「洗澡」,候選同義序列「鱷魚愛洗澡」包括文本片段「鱷魚」和「愛」以及「衝涼」的同義詞「洗澡」,候選同義序列「小頑皮洗澡」包括文本片段「衝涼」的同義詞「洗澡」,則查詢裝置2將候選同義序列「小頑皮愛洗澡」、「鱷魚愛洗澡」和「小頑皮洗澡」作為待處理的文本序列「鱷魚愛衝涼」的候選同義文本。
2)查詢裝置2進一步包括第一獲取裝置(圖未示)、子查詢裝置(圖未示)、第一確定裝置(圖未示)以及第二確定裝置(圖未示);第一獲取裝置獲取切詞所得的至少一個文本片段的同義詞;子查詢裝置在所述文本序列的候選同義序列庫中進行查詢,以獲得包含所述同義詞的候選同義序列;並且,當所述查詢所獲得的候選同義序列僅包含所述同義詞時,第一確定裝置直接將所述查詢到的候選同義序列作為所述候選同義文本;當所述查詢所獲得的候選同義序列包含所述同義詞以及其他文本信息時,第二確定裝置將所包含的其他文本信息與待處理的文本序列部分相同的候選同義序列,作為所述候選同義文本。
例如,待處理的文本序列「鱷魚愛衝涼」的文本片段包括「鱷魚」、「愛」和「衝涼」,候選同義序列庫包括「小頑皮愛洗澡」、「鱷魚愛洗澡」、「小頑皮洗澡」、「洗了麼」、「洗得如何」。
子查詢裝置在待處理的文本序列「鱷魚愛衝涼」的候選同義序列庫中查詢到候選同義序列「小頑皮愛洗澡」包含第一獲取裝置獲得的、文本片段「衝涼」的同義詞「洗澡」,且判斷候選同義序列「小頑皮愛洗澡」中的其他文本信息「小頑皮愛」與待處理的文本序列「鱷魚愛衝涼」中存在部分相同的文本信息「愛」,則第二確定裝置確定候選同義序列「小頑皮愛洗澡」為待處理的文本序列「鱷魚愛衝涼」的候選同義文本。
接著,類似地,查詢裝置2中的第一獲取裝置、子查詢裝置、第一確定裝置以及第二確定裝置繼續執行相應操作,確定候選同義序列「小頑皮愛洗澡」、「鱷魚愛洗澡」和「小頑皮洗澡」為待處理的文本序列「鱷魚愛衝涼」的候選同義文本。
需要說明的是,上述舉例僅為更好地說明本發明的技術方案,而非對本發明的限制,本領域技術人員應該理解,任何獲取切詞所得的至少一個文本片段的同義詞,並在所述文本序列的候選同義序列庫中進行查詢,以獲得包含所述同義詞的候選同義序列,並且,當所述查詢所獲得的候選同義序列僅包含所述同義詞時,直接將所述查詢到的候選同義序列作為所述候選同義文本,當所述查詢所獲得的候選同義序列包含所述同義詞以及其他文本信息時,將所包含的其他文本信息與待處理的文本序列部分相同的候選同義序列,作為所述候選同義文本的實現方式;例如,當子查詢裝置查詢所獲得的候選同義序列包含同義詞以及其他文本信息時,僅當所包含的其他文本信息與待處理的文本序列中除該候選同義序列包含的同義詞所對應的文本片段以外的文本片段全部或部分相同時,第二確定裝置才將該候選同義序列,作為所述候選同義文本等,均應包含在本發明的範圍內。
需要進一步說明的是,本領域技術人員應能理解,在對查詢裝置2的說明所限定的方式下,查詢裝置2可採用多種方式從候選同義序列庫中選出候選同義文本。例如,查詢裝置2可先查詢並確定所有包含文本片段的同義詞的候選文本序列,再從中選擇候選同義文本;或者,查詢裝置2也可逐一判斷各個候選文本序列是否為候選同義文本。
接著,第一選擇裝置3從候選同義文本中選擇待處理的文本序列的同義文本。
具體地,第一選擇裝置3從所述候選同義文本中選擇所述文本序列的同義文本的方式包括但不限於
I)第一選擇裝置3備根據候選同義文本與待處理的文本序列之間的關聯度,從候選同義文本中選擇同義文本。其中,候選同義文本與待處理的文本序列之間的關聯度越高, 則候選同義文本被第一選擇裝置3選擇為同義文本的可能性越高。
其中,該關聯度可基於多種因素確定,例如,基於在候選同義文本的搜索結果和待處理的文本序列的第一搜索結果中均被用戶點擊的搜索結果項的點擊信息來確定,其中, 搜索結果項的點擊信息包括但不限於搜索結果項的點擊率、點擊次數、被點擊時間、點擊頻率等;優選地,點擊率、點擊次數、點擊頻率等越高,則關聯度越高。優選地,關聯度還可基於候選同義文本包含的文本片段的同義詞與待處理的文本序列之間的預確定的接近程度,候選同義文本包含的同義詞在該候選同義文本中所佔的比例等來確定。
2)待處理的文本序列包括網絡資源名稱,第一選擇裝置3包括第二子選擇裝置 (圖未示),第二子選擇裝置通過對候選同義文本的全部或部分候選同義文本中的每一個執行以下操作A和B中的至少一項,來從所述候選同義文本中選擇所述文本序列的同義文本;其中,第二子選擇裝置可對候選同義文本中的每一項均執行以下操作A和/或B,或者, 第二子選擇裝置可按照候選同義文本與待處理的文本序列之間的關聯度由高至低的順序, 或者,按照基於諸如關聯度、預確定的重要度等參數確定的權值由高至低的順序,逐一對各個候選同義文本執行以下操作,直至獲得預定數量(如30個)或已對所有優選同義文本執行完下述操作A和/或B為止。
以下將對操作A和B進行說明
操作A :判斷待處理的文本序列以及當前處理的候選同義文本是否具有非同義特徵。
其中,所述非同義特徵包括任何能夠體現待處理的文本序列以及候選同義文本並非同義詞的特徵信息。優選地,該非同義特徵包括但不限於以下至少一項
I)待處理的文本序列所對應的網絡資源與候選同義文本所對應的網絡資源屬於不同品牌。
例如,屬於不同品牌的應用,如屬於QQ的QQ手機助理和屬於360的360手機助手坐寸ο
又例如,屬於不同品牌的影視作品等。
優選地,第二子選擇裝置可通過識別待處理的文本序列與候選同義文本中具有品牌特徵的文本信息,如QQ、360等,或者,獲取計算機設備或其他設備已預確定的、待處理的文本序列與候選同義文本的品牌信息,來確定待處理的文本序列所對應的網絡資源與候選同義文本所對應的網絡資源是否屬於不同品牌。
2)候選同義文本包含預定資源衍生詞彙;其中,該預定資源衍生詞彙包括與網絡資源相關但並非網絡資源本身的詞彙。
例如,與應用遊戲相關但不屬於應用遊戲本身的遊戲攻略、地圖、修改器;又例如, 與影視作品相關但不屬於影視作品的影評等。
3)所述候選同義文本包含預定資源片段特徵;其中,該預定資源片段特徵包括屬於資源的一個特定部分,而非形容資源整體的特徵。
例如,遊戲中的特定場景名稱;又例如,影視作品的剪輯名稱等。
4)待處理的文本序列與所述候選同義文本中的一者為另一者的具體實例。
例如,精確的應用名稱為泛用應用的具體實例,如「安兔兔跑分軟體」為「跑分軟體」的具體實例等。
優選地,第二子選擇裝置可通過識別待處理的文本序列與所述候選同義文本中的一者所屬分類是否為另一者的子分類,或者,識別一者是否為另一者的預定具體實例,或者,獲取計算機設備或其他設備已預確定的、待處理的文本序列與候選同義文本的具體實例信息,來確定待處理的文本序列與所述候選同義文本中的一者為另一者的具體實例。
5)待處理的文本序列以及所述候選同義文本中存在至少兩種語言的文本信息,且將其中一種語言翻譯為另一種語言所得的翻譯結果在該另一種語言的文本信息中不存在同義詞,也即,待處理的文本序列以及候選同義文本中一者的全部或部分文本信息從一種語言翻譯為另一種語言後,在另一者中不存在對應的同義詞。
例如,待處理的文本序列「sd card清理工具」以及候選同義文本「磁碟清理工具」 中存在英文與中文兩種語言的文本信息,且待處理的文本序列「sd card清理工具」中的文本片段英文「sd card」經翻譯後所得的中文「安全數碼卡」在候選同義文本「磁碟清理工具」中不存在對應的同義詞等。
需要說明的是,上述非同義特徵的舉例僅為更好地說明本發明的技術方案,而非對本發明的限制,本領域技術人員應該理解,任何能夠體現待處理的文本序列以及候選同義文本並非同義詞的特徵信息,均應包含在本發明的範圍內。
具體地,當判斷判斷待處理的文本序列以及當前處理的候選同義文本具有非同義特徵時,第二子選擇裝置不將當前處理的候選同義文本作為待處理的文本序列的同義文本。
例如,第二子選擇裝置不將與「360手機助手」屬於不同品牌「QQ手機助理」作為 「QQ手機助理」的同義文本;又例如,第二子選擇裝置不將文本序列「跑分軟體」的具體實例的候選同義文本「安兔兔跑分軟體」作為其同義文本等。
需要說明的是,上述舉例僅為更好地說明本發明的技術方案,而非對本發明的限制,本領域技術人員應該理解,任何當判斷判斷待處理的文本序列以及當前處理的候選同義文本具有非同義特徵時,不將當前處理的候選同義文本作為待處理的文本序列的同義文本的實現方式,均應包含在本發明的範圍內。
操作B :判斷當前處理的候選同義文本是否存在相應的網絡資源。
其中,當判斷存在相應的網絡資源時,第二子選擇裝置將當前處理的候選同義文本選擇為待處理的文本序列的同義文本。
具體地,第二子選擇裝置判斷當前處理的候選同義文本是否存在相應的網絡資源的方式包括但不限於
I)第二子選擇裝置獲取已預確定的、候選同義文本的網絡資源判斷結果,以判斷當前處理的候選同義文本是否存在相應的網絡資源。
例如,第二子選擇裝置獲取其或其他設備在第一選擇裝置3執行操作之前已預確定的、候選同義文本「鱷魚愛洗澡」在網絡中是否存在網絡資源的網絡資源判斷結果,判斷 「鱷魚愛洗澡」是否存在相應的網絡資源。
其中,預確定候選同義文本的網絡資源判斷結果的方式,與下述實現方式2)中第二子選擇裝置實時判斷當前處理的候選同義文本是否存在相應的網絡資源的方式相同或相似,在此不再贅述。
2)第二子選擇裝置實時判斷當前處理的候選同義文本是否存在相應的網絡資源。
優選地,第二子選擇裝置實時判斷當前處理的候選同義文本 是否存在相應的網絡資源的方式包括但不限於
i)第二子選擇裝置基於當前處理的候選同義文本,在預定網絡資源站點中進行資源搜索,並根據是否能夠獲得資源搜索結果,來判斷所述當前處理的候選同義文本在所述預定網絡資源站點中是否存在相應的網絡資源。
例如,預定網絡資源站點包括安卓(Android)站點,當前處理的候選同義文本包括「鱷魚愛洗澡」,第二子選擇裝置在安卓站點中基於「鱷魚愛洗澡」進行搜索,並根據是否能夠獲得資源搜索結果,來判斷「鱷魚愛洗澡」在安卓站點中是否存在相應的網絡資源。
ii)第二子選擇裝置基於當前處理的候選同義文本,進行網頁搜索,並根據是否能夠在搜索所得的網頁中提取出符合預定文本模板的文本信息,來判斷所述當前處理的候選同義文本是否存在相應的網絡資源,其中,所述預定文本模板包括所述當前處理的候選同義文本以及與其字符間隔小於預定閾值的預定詞彙。其中,預定文本模板可為一個或多個。
例如,預定文本模板包括「XXX下載」、「XXX小遊戲」以及「XXX遊戲下載」, 其中「XXX」表示當前處理的候選同義文本,預定詞彙「下載」、「小遊戲」以及「遊戲下載」與當前處理的候選同義文本之間的字符間隔小於等於I個字符;則第二子選擇裝置基於當前處理的候選同義文本「鱷魚愛洗澡」進行網頁搜索,並根據是否能夠在搜索所得的網頁中提取出符合預定文本模板「鱷魚愛洗澡下載/小遊戲/遊戲下載」的文本信息,判斷當前處理的候選同義文本「鱷魚愛洗澡」是否存在相應的網絡資源。
需要說明的是,第二子選擇裝置可基於所述當前處理的候選同義文本,在預定網絡資源站點中進行資源搜索,以及,基於所述當前處理的候選同義文本,進行網頁搜索,並根據是否能夠獲得資源搜索結果以及是否能夠在搜索所得的網頁中提取出符合預定文本模板的文本信息,判斷所述當前處理的候選同義文本是否存在相應的網絡資源。
需要說明的是,上述舉例僅為更好地說明本發明的技術方案,而非對本發明的限制,本領域技術人員應該理解,任何判斷當前處理的候選同義文本是否存在相應的網絡資源的實現方式,均應包含在本發明的範圍內。
需要說明的是,上述舉例僅為更好地說明本發明的技術方案,而非對本發明的限制,本領域技術人員應該理解,任何從候選同義文本中選擇待處理的文本序列的同義文本的實現方式,例如,從候選同義文本中隨機選擇預定數量的同義文本等,均應包含在本發明的範圍內。
本實施例中,能夠獲取在各自的搜索結果中均被用戶點擊的搜索結果項來建立關聯的待處理文本序列及其候選同義序列,並進一步通過多種方式判斷各個候選同義序列是否的確為待處理的文本序列的同義文本,從而能夠獲得現有技術中難以召回的待處理文本序列的同義詞,並能較好地提高待處理文本序列的同義詞判斷準確性。
作為本實施例的優選方案之一,待處理的文本序列包括應用名稱,本實施例的確定裝置還包括文本更新裝置(圖未示),對於待處理的文本序列的每個同義文本,當判斷待處理的文本序列及該同義文本中僅一者包含預定應用附加特徵信息時,該文本更新裝置根據預定應用附加特徵信息,更新待處理的文本序列或該同義文本,以使待處理的文本序列以及該同義文本均包含或均不包含所述應用附加特徵信息。
其中,所述預定應用附加特徵信息包括對應用名稱進行附加限定的特徵信息;例如,表示應用版本的特徵信息1、2等;表示應用效果的特徵信息3d等;表示應用免費的特徵信息lite、free等;表示應用適用的設備的特徵信息HD等。
優選地,文本更新裝置根據預定應用附加特徵信息,更新文本序列或該同義文本, 以使待處理的文本序列以及該同義文本均包含或均不包含所述應用附加特徵信息的方式包括但不限於
I)文本更新裝置在不包含預定應用附加特徵信息的一者中添加該應用附加特徵信息;
2)文本更新裝置在包含預定應用附加特徵信息的一者中刪除該預定應用附加特徵信息。
並且,對於一個待處理的文本序列和/或其所有同義文本,文本更新裝置僅執行上述更新方式I)或2)中的一者,以確保待處理的文本序列以及該同義文本均包含或均不包含預定應用附加特徵信息。
例如,第一選擇裝置3確定待處理的文本信息「海洋世界動態桌面」的同義文本包括「3d海洋世界動態桌面」,則文本更新裝置判斷「海洋世界動態桌面」和「3d海洋世界動態桌面」中僅一者包含預定應用附加特徵信息,則文本更新裝置刪除同義文本「3d海洋世界動態桌面」中的預定應用附加特徵信息「3d」,將同義文本更新為「海洋世界動態桌面」。
需要說明的是,上述舉例僅為更好地說明本發明的技術方案,而非對本發明的限制,本領域技術人員應該理解,任何對於待處理的文本序列的每個同義文本,當判斷待處理的文本序列及該同義文本中僅一者包含預定應用附加特徵信息時,根據預定應用附加特徵信息,更新待處理的文本序列或該同義文本,以使待處理的文本序列以及該同義文本均包含或均不包含所述應用附加特徵信息的實現方式,均應包含在本發明的範圍內。
本優選方案中,能夠對待處理的文本序列及其同義文本進行整理,確保兩者的統一性。
作為本實施例的優選方案之一,本實施例的確定裝置還包括接收裝置(圖未示) 以及提供裝置(圖未示),接收裝置接收用戶設備所請求搜索的文本序列,提供裝置基於所述文本序列及其同義文本進行搜索,並將搜索結果提供給所述用戶設備。
具體地,接收裝置接收用戶設備所請求搜索的文本序列,提供裝置基於所述文本序列及其同義文本分別進行搜索,並將基於文本序列及其同義詞分別所得的各個搜索結果項進行融合後,提供給用戶設備。
本實施例中,通過基於所請求搜索的文本序列及其同義文本進行搜索,能夠獲得單純基於文本序列進行搜索難以獲得且實際可能為用戶所需的搜索結果項。
圖4為本發明一個優選實施例的用於建立或更新候選同義序列庫的更新裝置的結構示意圖;本實施例的確定裝置包括匹配裝置4以及庫更新裝置5。
匹配裝置4將待處理的文本序列的第一搜索結果與其待挖掘序列的第二搜索結果進行匹配。
其中,所述第一搜索結果和第二搜索結果可為分別基於待處理的文本序列和待挖掘序列進行實時搜索所得的搜索結果,也可分別為待處理的文本序列和待挖掘序列的歷史搜索結果。
其中,匹配裝置4可採用多種方式來將第一搜索結果與第二搜索結果進行匹配。
例如,匹配裝置4先獲得第一搜索結果和第二搜索結果,再將兩者進行比對。
又例如,當第一搜索結果和第二搜索結果為歷史搜索結果時,匹配裝置4查詢第一搜索結果包含的各個搜索結果項在其他搜索結果中出現的歷史記錄,以確定第一搜索結果中是否存在出現在第二搜索結果中的搜索結果項,從而確定第一搜索結果和第二搜索結果的匹配結果等。
需要說明的是,上述舉例僅為更好地說明本發明的技術方案,而非對本發明的限制,本領域技術人員應該理解,任何將待處理的文本序列的第一搜索結果與其待挖掘序列的第二搜索結果進行匹配的實現方式,均應包含在本發明的範圍內。
當所述匹配的結果符合第一預定條件時,庫更新裝置5根據所述待挖掘序列建立或更新所述待處理的文本序列的候選同義序列庫;其中,所述第一預定條件包括所述第一搜索結果與所述第二搜索結果包含至少一個相同的搜索結果項。
例如,當匹配裝置4匹配到第一搜索結果和第二搜索結果均包含搜索結果項C時, 庫更新裝置5直接將待挖掘序列作為待處理的文本序列的候選同義序列,加入其候選同義序列庫中,或對該候選同義序列進行諸如去除無意義信息等調整後,加入候選同義序列庫中。
需要說明的是,上述舉例僅為更好地說明本發明的技術方案,而非對本發明的限制,本領域技術人員應該理解,任何當所述匹配的結果符合第一預定條件時,根據所述待挖掘序列建立或更新所述待處理的文本序列的候選同義序列庫的實現方式,均應包含在本發明的範圍內。
作為本實施例的一種優選方案,第一預定條件包括所述第一搜索結果與所述第二搜索結果包含的相同的搜索結果項的數量超過第一預定閾值。例如,第一搜索結果和第二搜索結果包含相同的30個以上的搜索結果項等。
由於若一個搜索結果項出現在兩個文本序列的搜索結果中,則可認為儘管用戶輸入了不同的文本序列,但其希望搜索的對象是相同或相似的,本發明據此來挖掘一個文本序列的候選同義序列,能夠獲得基於現有技術的方案難以召回的候選同義序列。
作為本實施例的另一種優選方案,第一搜索結果與所述第二搜索結果分別為所述待處理的文本序列以及所述待挖掘序列的歷史搜索結果,前述匹配裝置4包括子匹配裝置(圖未示)。
子匹配裝置根據待處理的文本序列以及待挖掘序列的歷史搜索結果的用戶點擊信息,將所述第一搜索結果與所述第二搜索結果進行匹配;
其中,本實施例中,所述第一預定條件包括所述待處理的文本序列和所述待挖掘序列的歷史搜索結果中包含至少一個相同的、且均被用戶點擊的搜索結果項。
例如,基於待處理的文本序列queryl進行搜索所得的歷史搜索結果包括搜索結果項C1、C2和C3,其中,搜索結果項Cl和C2在queryl的歷史搜索結果被呈現時,被用戶點擊;基於另一文本序列query2的所得的歷史搜索結果中包括搜索結果項Cl和C2,且搜索結果項Cl在query2的搜索結果被呈現給用戶時,被用戶點擊;基於另一文本序列query3 的所得的歷史搜索結果中包括搜索結果項Cl和C3,且搜索結果項C3在query3的搜索結果被呈現給用戶時,被用戶點擊;則基於待處理的文本序列queryl所得的歷史搜索結果 (即第一搜索結果)與基於文本序列query2所得的歷史搜索結果(即第二搜索結果)中存在相同的、且在第一搜索結果和第二搜索結果中均被用戶點擊的搜索結果項Cl,文本序列query2為待處理的文本序列queryl的候選同義序列。而文本序列query3不是待處理的文本序列queryl的候選同義序列。
優選地,在上述優選方案中,第一預定條件還包括所述均被用戶點擊的搜索結果項的點擊信息符合第二預定條件。
其中,所述第二預定條件包括能夠被確定為候選同義序列的待挖掘文本序列的點擊信息所應符合的條件,如點擊率超過一預定閾值、點擊規律符合預定規律等。
例如,第二預定條件包括將在第一搜索結果和第二搜索結果中均被用戶點擊的各個搜索結果項的點擊次數相加所得的值超過預確定的閾值。
需要說明的是,優選地,第一預定條件可包括上述優選方案中的所有條件;例如, 第一預定條件可包括第一搜索結果與第二搜索結果包含的相同的、且均被用戶點擊的搜索結果項的數量超過第一預定閾值;又例如,第一預定條件可包括第一搜索結果與第二搜索結果包含的相同的、且均被用戶點擊的搜索結果項的數量超過第一預定閾值,並且,該等均被用戶點擊的搜索結果項的點擊信息符合第二預定條件等。
作為本實施例的另一種優選方案,本實施例的更新裝置還包括迭代裝置(圖未示)O
當所述匹配結束後,迭代裝置選擇另一個序列作為待處理的文本序列的待挖掘序列,以觸發匹配裝置和庫更新裝置執行操作,直至滿足預定停止條件,如被操作人員終止重複操作,或者,待處理的文本序列的候選同義文本庫中包含的候選同義文本數量已達到 1000 等。
優選地,當通過上述方式確定的候選同義序列超過N個時,更新裝置可根據第一搜索結果與第二搜索結果的匹配程度高低,選擇排序前N位的待挖掘文本序列,作為待處理的文本序列的候選同義序列,其中,N為預定序列數量閾值。
由於若一個搜索結果項出現在兩個文本序列的搜索結果中,且均被用戶點擊,則可認為儘管用戶輸入了不同的文本序列,但其希望搜索的對象是相同或相似的。本優選方案據此來挖掘一個文本序列的候選同義序列,能夠獲得基於現有技術的方案難以召回的候選同義序列;進一步地,由於在兩個搜索結果中均被用戶點擊的次數、頻率等越高,其且均被用戶點擊的搜索結果項的數量越多,則用戶認為該兩個搜索結果項指向同一搜索對象的可能性越大,據此,本優選方案還能夠基於均被用戶點擊的搜索結果項的點擊信息,進一步篩選候選同義序列。
需要注意的是,本發明可在軟體和/或軟體與硬體的組合體中被實施,例如,本發明的各個裝置可採用專用集成電路(ASIC)或任何其他類似硬體設備來實現。在一個實施例中,本發明的軟體程序可以通過處理器執行以實現上文所述步驟或功能。同樣地,本發明的軟體程序(包括相關的數據結構)可以被存儲到計算機可讀記錄介質中,例如,RAM存儲器,磁或光碟機動器或軟磁碟及類似設備。另外,本發明的一些步驟或功能可採用硬體來實現,例如,作為與處理器配合從而執行各個步驟或功能的電路。
對於本領域技術人員而言,顯然本發明不限於上述示範性實施例的細節,而且在不背離本發明的精神或基本特徵的情況下,能夠以其他的具體形式實現本發明。因此,無論從哪一點來看,均應將實施例看作是示範性的,而且是非限制性的,本發明的範圍由所附權利要求而不是上述說明限定,因此旨在將落在權利要求的等同要件的含義和範圍內的所有變化涵括在本發明內。不應將權利要求中的任何附圖標記視為限制所涉及的權利要求。此外,顯然「包括」 一詞不排除其他單元或步驟,單數不排除複數。系統權利要求中陳述的多個單元或裝置也可以由一個單元或裝置通過軟體或者硬體來實現。第一,第二等詞語用來表示名稱,而並不表示任何特定的順序。2權利要求
1.一種用於建立或更新候選同義序列庫的方法,其中,該方法包括以下步驟 A將待處理的文本序列的第一搜索結果與其待挖掘序列的第二搜索結果進行匹配; 其中,該方法還包括以下步驟 X當所述匹配的結果符合第一預定條件時,根據所述待挖掘序列建立或更新所述待處理的文本序列的候選同義序列庫; 其中,所述第一預定條件包括所述第一搜索結果與所述第二搜索結果包含至少一個相同的搜索結果項。
2.根據權利要求I所述的方法,其中,所述第一預定條件包括所述第一搜索結果與所述第二搜索結果包含的所述相同的搜索結果項的數量超過第一預定閾值。
3.根據權利要求I所述的方法,其中,所述第一搜索結果與所述第二搜索結果分別為所述待處理的文本序列以及所述待挖掘序列的歷史搜索結果,其中,所述步驟A包括以下步驟 -根據所述待處理的文本序列以及所述待挖掘序列的所述歷史搜索結果的用戶點擊信息,將所述第一搜索結果與所述第二搜索結果進行匹配; 其中,所述第一預定條件包括所述待處理的文本序列和所述待挖掘序列的歷史搜索結果中包含至少一個相同的、且均被用戶點擊的搜索結果項。
4.根據權利要求3所述的方法,其中,所述第一預定條件還包括所述均被用戶點擊的搜索結果項的點擊信息符合第二預定條件。
5.根據權利要求I至4中任一項所述的方法,其中,該方法還包括以下步驟 -當所述匹配結束後,選擇另一個序列作為所述待處理的文本序列的待挖掘序列,重複所述步驟A和X。
6.一種用於確定同義文本的方法,其中,該方法包括以下步驟 a對待處理的文本序列進行切詞,獲得至少一個文本片段; b根據所述至少一個文本片段,在所述文本序列的候選同義序列庫中進行查詢,獲得包含所述至少一個文本片段或其同義詞中的一個或多個的候選同義序列,作為所述文本序列的候選同義文本,其中,基於所述文本序列所得的第一搜索結果與基於所述候選同義序列所得的第二搜索結果的匹配結果符合第一預定條件; c從所述候選同義文本中選擇所述文本序列的同義文本; 其中,所述第一預定條件包括所述第一搜索結果與所述第二搜索結果包含至少一個相同的搜索結果項。
7.根據權利要求6所述的方法,其中,所述步驟b包括以下步驟 -獲取所述至少一個文本片段的同義詞; -在所述文本序列的候選同義序列庫中進行查詢,以獲得包含所述同義詞的候選同義序列; -當所述查詢所獲得的候選同義序列僅包含所述同義詞時,直接將所述查詢到的候選同義序列作為所述候選同義文本; -當所述查詢所獲得的候選同義序列包含所述同義詞以及其他文本信息時,將所包含的其他文本信息與所述文本序列部分相同的候選同義序列,作為所述候選同義文本。
8.根據權利要求6或7所述的方法,其中,所述文本序列包括網絡資源名稱,所述步驟C包括以下步驟 -通過對所述候選同義文本的全部或部分候選同義文本中的每一個執行以下至少一項操作,來從所述候選同義文本中選擇所述文本序列的同義文本 操作A :判斷所述文本序列以及當前處理的候選同義文本是否具有非同義特徵; 操作B :判斷當前處理的候選同義文本是否存在相應的網絡資源。
9.根據權利要求8所述的方法,其中,所述非同義特徵包括以下至少一項 -所述文本序列所對應的網絡資源與所述候選同義文本所對應的網絡資源屬於不同品牌; -所述候選同義文本包含預定資源衍生詞彙; -所述候選同義文本包含預定資源片段特徵; -所述文本序列與所述候選同義文本中的一者為另一者的具體實例; -所述文本序列以及所述候選同義文本中存在至少兩種語言的文本信息,且將其中一種語言翻譯為另一種語言所得的翻譯結果在該另一種語言的文本信息中不存在同義詞。
10.根據權利要求8或9所述的方法,其中,所述操作B包括 -基於所述當前處理的候選同義文本,在預定網絡資源站點中進行資源搜索,並根據是否能夠獲得資源搜索結果,來判斷所述當前處理的候選同義文本在所述預定網絡資源站點中是否存在相應的網絡資源。
11.根據權利要求8至10中任一項所述的方法,其中,所述操作B包括 -基於所述當前處理的候選同義文本,進行網頁搜索,並根據是否能夠在搜索所得的網頁中提取出符合預定文本模板的文本信息,來判斷所述當前處理的候選同義文本是否存在相應的網絡資源,其中,所述預定文本模板包括所述當前處理的候選同義文本以及與其字符間隔小於預定閾值的預定詞彙。
12.根據權利要求6至11中任一項所述的方法,其中,所述文本序列包括應用名稱,該方法還包括以下步驟 -對於所述文本序列的每個同義文本,當判斷所述文本序列及該同義文本中僅一者包含預定應用附加特徵信息時,根據所述預定應用附加特徵信息,更新所述文本序列或該同義文本,以使所述文本序列以及該同義文本均包含或均不包含所述應用附加特徵信息。
13.根據權利要求6至12中任一項所述的方法,其中,該方法還包括以下步驟 -接收用戶設備所請求搜索的文本序列; -基於所述文本序列及其同義文本進行搜索,並將搜索結果提供給所述用戶設備。
14.一種用於建立或更新候選同義序列庫的更新裝置,其中,該更新裝置包括 匹配裝置,用於將待處理的文本序列的第一搜索結果與其待挖掘序列的第二搜索結果進行匹配; 庫更新裝置,用於當所述匹配的結果符合第一預定條件時,根據所述待挖掘序列建立或更新所述待處理的文本序列的候選同義序列庫; 其中,所述第一預定條件包括所述第一搜索結果與所述第二搜索結果包含至少一個相同的搜索結果項。
15.根據權利要求14所述的更新裝置,其中,所述第一預定條件包括所述第一搜索結果與所述第二搜索結果包含的所述相同的搜索結果項的數量超過第一預定閾值。
16.根據權利要求14所述的更新裝置,其中,所述第一搜索結果與所述第二搜索結果分別為所述待處理的文本序列以及所述待挖掘序列的歷史搜索結果,其中,所述匹配裝置包括 子匹配裝置,用於根據所述待處理的文本序列以及所述待挖掘序列的所述歷史搜索結果的用戶點擊信息,將所述第一搜索結果與所述第二搜索結果進行匹配; 其中,所述第一預定條件包括所述待處理的文本序列和所述待挖掘序列的歷史搜索結果中包含至少一個相同的、且均被用戶點擊的搜索結果項。
17.根據權利要求16所述的更新裝置,其中,所述第一預定條件還包括所述均被用戶點擊的搜索結果項的點擊信息符合第二預定條件。
18.根據權利要求14至17中任一項所述的更新裝置,其中,該更新裝置還包括 迭代裝置,用於當所述匹配結束後,選擇另一個序列作為所述待處理的文本序列的待挖掘序列,以觸發所述匹配裝置和所述庫更新裝置執行操作。
19.一種用於確定同義文本的同義文本確定裝置,其中,該同義文本確定裝置包括 切詞裝置,用於對待處理的文本序列進行切詞,獲得至少一個文本片段; 查詢裝置,用於根據所述至少一個文本片段,在所述文本序列的候選同義序列庫中進行查詢,獲得包含所述至少一個文本片段或其同義詞中的一個或多個的候選同義序列,作為所述文本序列的候選同義文本,其中,基於所述文本序列所得的第一搜索結果與基於所述候選同義序列所得的第二搜索結果的匹配結果符合第一預定條件; 第一選擇裝置,用於從所述候選同義文本中選擇所述文本序列的同義文本; 其中,所述第一預定條件包括所述第一搜索結果與所述第二搜索結果包含至少一個相同的搜索結果項。
20.根據權利要求19所述的同義文本確定裝置,其中,所述查詢裝置包括 第一獲取裝置,用於獲取所述至少一個文本片段的同義詞; 子查詢裝置,用於在所述文本序列的候選同義序列庫中進行查詢,以獲得包含所述同義詞的候選同義序列; 第一確定裝置,用於當所述查詢所獲得的候選同義序列僅包含所述同義詞時,直接將所述查詢到的候選同義序列作為所述候選同義文本; 第二確定裝置,用於當所述查詢所獲得的候選同義序列包含所述同義詞以及其他文本信息時,將所包含的其他文本信息與所述文本序列部分相同的候選同義序列,作為所述候選同義文本。
21.根據權利要求19或20所述的同義文本確定裝置,其中,所述文本序列包括網絡資源名稱,所述第一選擇裝置包括 第二子選擇裝置,用於通過對所述候選同義文本的全部或部分候選同義文本中的每一個執行以下至少一項操作,來從所述候選同義文本中選擇所述文本序列的同義文本 操作A :判斷所述文本序列以及當前處理的候選同義文本是否具有非同義特徵; 操作B :判斷當前處理的候選同義文本是否存在相應的網絡資源。
22.根據權利要求21所述的同義文本確定裝置,其中,所述非同義特徵包括以下至少一項 -所述文本序列所對應的網絡資源與所述候選同義文本所對應的網絡資源屬於不同品牌; -所述候選同義文本包含預定資源衍生詞彙; -所述候選同義文本包含預定資源片段特徵; -所述文本序列與所述候選同義文本中的一者為另一者的具體實例; -所述文本序列以及所述候選同義文本中存在至少兩種語言的文本信息,且將其中一種語言翻譯為另一種語言所得的翻譯結果在該另一種語言的文本信息中不存在同義詞。
23.根據權利要求21或22所述的同義文本確定裝置,其中,所述操作B包括 -基於所述當前處理的候選同義文本,在預定網絡資源站點中進行資源搜索,並根據是否能夠獲得資源搜索結果,來判斷所述當前處理的候選同義文本在所述預定網絡資源站點中是否存在相應的網絡資源。
24.根據權利要求21至23中任一項所述的同義文本確定裝置,其中,所述操作B包括 -基於所述當前處理的候選同義文本,進行網頁搜索,並根據是否能夠在搜索所得的網頁中提取出符合預定文本模板的文本信息,來判斷所述當前處理的候選同義文本是否存在相應的網絡資源,其中,所述預定文本模板包括所述當前處理的候選同義文本以及與其字符間隔小於預定閾值的預定詞彙。
25.根據權利要求19至24中任一項所述的同義文本確定裝置,其中,所述文本序列包括應用名稱,該同義文本確定裝置還包括 文本更新裝置,用於對於所述文本序列的每個同義文本,當判斷所述文本序列及該同義文本中僅一者包含預定應用附加特徵信息時,根據所述預定應用附加特徵信息,更新所述文本序列或該同義文本,以使所述文本序列以及該同義文本均包含或均不包含所述應用附加特徵信息。
26.根據權利要求19至25中任一項所述的同義文本確定裝置,其中,該同義文本確定裝置還包括 接收裝置,用於接收用戶設備所請求搜索的文本序列; 提供裝置,用於基於所述文本序列及其同義文本進行搜索,並將搜索結果提供給所述用戶設備。
全文摘要
本發明提供一種用於確定同義文本的方法和裝置。本發明對待處理的文本序列進行切詞,獲得至少一個文本片段;並根據所述至少一個文本片段,在所述文本序列的候選同義序列中進行查詢,獲得包含所述至少一個文本片段或其同義詞中的一個或多個的候選同義序列;並從所述候選同義文本中選擇所述文本序列的同義文本。與現有技術相比,本發明能夠獲得現有技術中難以召回的待處理文本序列的同義詞,並能較好地提高待處理文本序列的同義詞判斷準確性。
文檔編號G06F17/30GK102982125SQ20121045708
公開日2013年3月20日 申請日期2012年11月14日 優先權日2012年11月14日
發明者劉欽 申請人:百度在線網絡技術(北京)有限公司

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀