新四季網

一種應用於機頂盒的輸入方法及其裝置的製作方法

2023-05-29 07:56:56

專利名稱:一種應用於機頂盒的輸入方法及其裝置的製作方法
技術領域:
本發明涉及機頂盒技術領域,尤其涉及一種應用於機頂盒的輸入方法及其裝置。
背景技術:
隨著嵌入式系統在家電、娛樂、通信等領域的應用不斷發展,嵌入式系統越來越需要一個界面友好、支持中文的圖形系統。目前在嵌入式系統中廣泛使用的圖形系統對中文顯示已有很好的支持,但都不支持中文的輸入,因此中文輸入法在嵌入式圖形系統中的實現,對於嵌入式相關產品的應用具有極強的現實意義。中文的拼音輸入法是自然語言的計算機處理學科的一個分支。從自然語言的角度,漢語是一種詞語豐富,格式自由的語言,而拼音類型相對比較少,因此單個或幾個拼音單元能匹配到的漢字詞組往往有很多,而且詞長度的組合也會有多種,這些因素大大增加了中文輸入法的計算複雜度。在嵌入式系統下實現中文輸入主要涉及兩個方面漢字顯示和中文輸入。漢字顯示特別是點陣漢字的顯示相對簡單,許多嵌入式系統已經支持,滿足了大部分應用的需求,輸入法一般都要支持一、二級常用漢字的輸入,一些簡單的系統只實現一級漢字的輸入。詞組聯想功能則可根據需要決定是否實現,即使要實現,往往也是對一級漢字實現詞組聯想。與個人計算機(Personal Computer, PC)相比,機頂盒的中央處理器(CentralProcessing Unit,CPU)速度有限;而與字詞級別的輸入相比,整句輸入需要佔用更多的CPU線程,因此高效的查找算法對於系統的性能至關重要。當前常用的查找算法基於詞庫的寬帶為N的倒序查找算法。若詞庫文件正序排列,則整句輸入時用戶每輸入一個字的編碼後,都需要在詞庫中查找多次,觀察是否有滿足條件的詞。以編碼長度L en為3為例,若輸入序列為「042,68*,337,50*,076,707,317,8*」,期望輸出序列是「他是該事的見證人」。當前用戶輸入編碼為「503」中的「3」時,需要去詞庫中分別定位以編碼「042」、「68*」、「337」、「50*」開頭的詞,然後在其定位的位置查找編碼為「042,68*,337,50*」,「68*,337,50*」和「337,50*」,「50*」的詞,這樣需要查找字詞庫文件四次。實際上,輸入序列越長,定位、查找詞庫的次數越多。現有技術存在以下缺陷傳統的編碼結構設計與現有技術中輸入方法的結構設計不同,在使用現有輸入方法時通過需要重新設計文件索引結構,詞庫文件結構;傳統設計不能有效快速匹配從詞庫搜索到的整句,不利於提高搜索效率。

發明內容
本發明的目的在於克服現有技術的不足,本發明提供了一種應用於機頂盒的輸入方法及其裝置,提高了詞庫的搜索效率,降低了計算複雜度,提高了機頂盒的輸入性能。為了解決上述問題,本發明提出了一種應用於機頂盒的輸入方法,所述方法包括輸入機頂盒用戶的輸入指令對應的拼音串;
將所述拼音串切分為多個詞組對應的拼音串;根據切分完的多個拼音串進行詞組匹配,獲得多個拼音串對應的漢字詞組;獲取各個漢字詞組的組合概率,並輸出組合概率最高的漢字詞組組合。優選地,所述根據切分完的多個拼音串進行詞組匹配,獲得多個拼音串對應的漢字詞組的步驟包括在切分完的拼音串上選擇漢字詞組;獲取各個漢字詞組對應的概率;根據所獲得的概率選擇確認的漢字詞組,組成新的漢字詞組。優選地,在所述獲取各個漢字詞組的組合概率的步驟之前還包括在新的漢字詞組後面添加後續詞組形成組合的漢字詞組,並根據新的漢字詞組的概率及後續詞組的概率獲得組合的漢字詞組的組合概率。優選地,所述方法還包括保存組合的漢字詞組的組合概率。優選地,所述在新的漢字詞組後面添加後續詞組形成組合的漢字詞組的步驟具體是在新的漢字詞組後面添加不同的後續詞組形成不同組合的漢字詞組。相應地,本發明實施例還提供一種應用於機頂盒的輸入裝置,所述裝置包括輸入模塊,用於輸入機頂盒用戶的輸入指令對應的拼音串;切分模塊,用於將所述輸入模塊所輸入的拼音串切分為多個詞組對應的拼音串;匹配模塊,用於根據所述切分模塊切分完的多個拼音串進行詞組匹配,獲得多個拼首串對應的漢字詞組;輸出模塊,用於獲取各個漢字詞組的組合概率,並輸出組合概率最高的漢字詞組組合。優選地,所述匹配模塊包括選擇單元,用於在切分完的拼音串上選擇漢字詞組;概率獲取單元,用於獲取各個漢字詞組對應的概率;組成單元,用於根據所獲得的概率選擇確認的漢字詞組,組成新的漢字詞組。優選地,所述裝置還包括添加模塊,用於在新的漢字詞組後面添加後續詞組形成組合的漢字詞組,並根據新的漢字詞組的概率及後續詞組的概率獲得組合的漢字詞組的組合概率。優選地,所述裝置還包括保存模塊,用於保存組合的漢字詞組的組合概率。優選地,所述添加模塊還用於在新的漢字詞組後面添加不同的後續詞組形成不同組合的漢字詞組。實施本發明實施例,通過對機頂盒用戶輸入內容的檢測記憶,使機頂盒能夠智能獲取用戶想要輸入的內容;通過每次記錄用戶的使用頻率來提高輸入的準確性,提高了詞庫的搜索效率,降低了計算複雜度,提高了機頂盒的輸入性能。


為了更清楚地說明本發明實施例或現有技術中的技術方案,下面將對實施例或現有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發明的一些實施例,對於本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其它的附圖。圖1是本發明實施例的應用於機頂盒的輸入方法的流程示意圖;圖2是本發明實施例的應用於機頂盒的輸入裝置的結構組成示意圖。
具體實施例方式下面將結合本發明實施例中的附圖,對本發明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發明一部分實施例,而不是全部的實施例。基於本發明中的實施例,本領域普通技術人員在沒有作出創造性勞動前提下所獲得的所有其他實施例,都屬於本發明保護的範圍。圖1是本發明實施例的應用於機頂盒的輸入方法的流程示意圖,如圖1所示,該方法包括:S101,輸入機頂盒用戶的輸入指令對應的拼音串;S102,將拼音串切分為多個詞組對應的拼音串;S103,根據切分完的多個拼音串進行詞組匹配,獲得多個拼音串對應的漢字詞組;S104,獲取各個漢字詞組的組合概率,並輸出組合概率最高的漢字詞組組合。具體實施中,S103包括:在切分完的拼音串上選擇漢字詞組;獲取各個漢字詞組對應的概率;根據所獲得的概率選擇確認的漢字詞組,組成新的漢字詞組。在所述獲取各個漢字詞組的組合概率的步驟之前還包括:在新的漢字詞組後面添加後續詞組形成組合的漢字詞組,並根據新的漢字詞組的概率及後續詞組的概率獲得組合的漢字詞組的組合概率;具體實施中,可以在新的漢字詞組後面添加不同的後續詞組形成不同組合的漢字詞組。進一步的,該方法還包括:保存組合的漢字詞組的組合概率。在本發明實施例中,對於拼音整句翻譯主要包括拼音串切分和詞組匹配。一句拼音串中包含多個詞組,通常漢字詞組是多種多樣的,如果長度為三的拼音串,可能是由一個一字詞組和一個兩字詞組組成(下面簡稱為1-2組合,其他也類似),也有可能2-1組合,也有可能1-1-1組合或3組合,隨拼音串長度的增加,組合方案的個數迅速增加;詞組匹配的任務是在切分好的拼音串上選擇漢字詞組,計算這種漢字詞組組合方案的總概率,選擇總概率最高的作為最終輸出(這裡的概率為普通概率即普通個體與總體之比,句子切分為依次暴力切分的組合)。可見,如果是15字的拼音串,在理論上可以有上億種輸出可能。而中文輸入法作為應用工具,對響應速度也有比較高的要求,「查全率」和「速度」是一個相互制約的指標,這就要求輸入方法在一定的「查全率」的基礎上,通過提高匹配效率提高「速度」。在本發明實施例中,句子是由漢字詞組(片段)組成的,一個片段加上一個詞組後組合成一個更大的片段,直到加上最後一個詞組後,組合成了一個句子。在實施過程中,假設一,組合概率函數是相對詞組的組合概率是嚴格單調的,即如果f = G(n, a),其中,η是片段,a是追加詞組,有兩個候選詞組al和a2,如al>a2,貝丨J fl必然大於f2,而且在最終的組合中Fl也必然大於F2。這個假設在常用句型中是通常是成立的。假設二,漢語句子是馬爾可夫一次相關的,即一個詞組的組合概率只和與它相鄰部分有關。從這個假設出發,一個片段加上一個詞組的概率可以由片段的概率和這個詞組的概率計算得到,而與片段內部無關。根據以上兩點假設,一個片段可以由於加上的詞組不同,而組成不同的組合方式,但這個片段的固有概率在不同的組合方式中是相同的,可以被重複使用的。所以,,可以從句首組合小的片段,並把計算得到的該片段概率儲存起來;而後,嘗試添加一個後續詞組,選擇最大概率的組合作為到達這個位置的新片段,並儲存這個概率。由於到達該點的最後一個詞組的長度可以不一樣,所以到達該點的片段也是多個的,它們的概率被分別儲存;如此類推,直到匹配到句尾,有最終最大總概率的片段就是最終的輸出。(此處假設為考慮大部分情況忽略少數特殊的個例,不影響算法準確性)字庫在匹配時與用戶輸入的拼音進行比對,提供的各種參數,具體實施中,可通過下面的代碼對一個字庫數據區結構進行定義Struct element {Int Len Word;//詞組的字長String pinyinStr;//拼音串String Hanzi ; // 漢字詞組Int freq;//詞組頻度Int offset; //到轉移矩陣的偏移}為存儲匹配過程中各片段的概率,再建立如下數組(以下簡稱為匹配數組)Struct Pianduan {ffchar HzWord;//該片段最後一個一字詞組Int SubProl;//包含該詞組的片段最高的概率Int perLinkl;//指向該最高概率片段中,前一個詞組.....//相應的二三字詞組ffchar Hzfford4[4] ;//該片段最後一個四字詞組Int SubPro4; //包含該詞組的片段最高的概率Int perLink4;//指向該最高概率片段中,前一個詞組String HzffordM;//包含該詞組的片段最高的概率Int HzWordML;//多字詞組的字長Int SubProM;//包含該詞組的片段最高的概率Int perLinkM;//指向該最高概率片段中,前一個詞組}另外,可通過以下代碼實現匹配的過程,包括預查、比對和輸出。
權利要求
1.一種應用於機頂盒的輸入方法,其特徵在於,所述方法包括: 輸入機頂盒用戶的輸入指令對應的拼音串; 將所述拼音串切分為多個詞組對應的拼音串; 根據切分完的多個拼音串進行詞組匹配,獲得多個拼音串對應的漢字詞組; 獲取各個漢字詞組的組合概率,並輸出組合概率最高的漢字詞組組合。
2.如權利要求1所述的應用於機頂盒的輸入方法,其特徵在於,所述根據切分完的多個拼音串進行詞組匹配,獲得多個拼音串對應的漢字詞組的步驟包括: 在切分完的拼音串上選擇漢字詞組; 獲取各個漢字詞組對應的概率; 根據所獲得的概率選擇確認的漢字詞組,組成新的漢字詞組。
3.如權利要求2所述的應用於機頂盒的輸入方法,其特徵在於,在所述獲取各個漢字詞組的組合概率的步驟之前還包括:在新的漢字詞組後面添加後續詞組形成組合的漢字詞組,並根據新的漢字詞組的概率及後續詞組的概率獲得組合的漢字詞組的組合概率。
4.如權利要求3所述的應用於機頂盒的輸入方法,其特徵在於,所述方法還包括:保存組合的漢字詞組的組合概率。
5.如權利要求3所述的應用於機頂盒的輸入方法,其特徵在於,所述在新的漢字詞組後面添加後續詞組形成組合的漢字詞組的步驟具體是:在新的漢字詞組後面添加不同的後續詞組形成不同組合的漢字詞組。
6.一種應用於機頂盒的輸入裝置,其特徵在於,所述裝置包括: 輸入模塊,用於輸入機頂盒用戶的輸入指令對應的拼音串; 切分模塊,用於將所述輸入模塊所輸入的拼音串切分為多個詞組對應的拼音串; 匹配模塊,用於根據所述切分模塊切分完的多個拼音串進行詞組匹配,獲得多個拼音串對應的漢字詞組; 輸出模塊,用於獲取各個漢字詞組的組合概率,並輸出組合概率最高的漢字詞組組合。
7.如權利要求6所述的應用於機頂盒的輸入裝置,其特徵在於,所述匹配模塊包括: 選擇單元,用於在切分完的拼音串上選擇漢字詞組; 概率獲取單元,用於獲取各個漢字詞組對應的概率; 組成單元,用於根據所獲得的概率選擇確認的漢字詞組,組成新的漢字詞組。
8.如權利要求7所述的應用於機頂盒的輸入裝置,其特徵在於,所述裝置還包括添加模塊,用於在新的漢字詞組後面添加後續詞組形成組合的漢字詞組,並根據新的漢字詞組的概率及後續詞組的概率獲得組合的漢字詞組的組合概率。
9.如權利要求8所述的應用於機頂盒的輸入裝置,其特徵在於,所述裝置還包括保存模塊,用於保存組合的漢字詞組的組合概率。
10.如權利要求8所述的應用於機頂盒的輸入裝置,其特徵在於,所述添加模塊還用於在新的漢字詞組後面添加不同的後續詞組形成不同組合的漢字詞組。
全文摘要
本發明實施例公開了一種應用於機頂盒的輸入方法及其裝置,其中,該方法包括輸入機頂盒用戶的輸入指令對應的拼音串;將所述拼音串切分為多個詞組對應的拼音串;根據切分完的多個拼音串進行詞組匹配,獲得多個拼音串對應的漢字詞組;獲取各個漢字詞組的組合概率,並輸出組合概率最高的漢字詞組組合。實施本發明實施例,通過對機頂盒用戶輸入內容的檢測記憶,使機頂盒能夠智能獲取用戶想要輸入的內容;通過每次記錄用戶的使用頻率來提高輸入的準確性,提高了詞庫的搜索效率,降低了計算複雜度,提高了機頂盒的輸入性能。
文檔編號G06F17/27GK103077213SQ20121058559
公開日2013年5月1日 申請日期2012年12月28日 優先權日2012年12月28日
發明者王佳, 羅笑南, 孟思明, 陳湘萍 申請人:中山大學

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀