新四季網

漢語聲控電腦打字機的製作方法

2023-05-27 14:12:41

專利名稱:漢語聲控電腦打字機的製作方法
技術領域:
本發明屬語言通訊和電子打字機技術。
要求計算機俗稱電腦聽懂人類的自然語言是當前世界上尚未完全解決的重大難題,而語言的計算機識別是解決這一難題的關鍵。對於特定人的孤立字、詞、小詞彙的語音識別技術,目前國內外都已經比較成熟。對於英語、德語、和日語的幾百個孤立字、詞的較大詞彙集的語言識別系統都已經出現。美國IBM(國際商業機器)公司從1978年就開始研製大詞彙集的英語聲控電腦打字機,在1986年的IEEE(美國電子電氣工程師協會)國際資訊理論會議上,IBM公司以F.Jelinek(F.傑林尼克)為首的研究小組推出一種英語語音識別系統,在IBM-PC/AT微型計算機上實現了5,000個字、詞的識別〔F.Jelinek,「Speechrecognitionbystatisticalmethods」,Abstractsofpapers,1986.IEEE.ISIT.(F.傑林尼克,「統計方法的語音識別」,一九八六年IEEE國際資訊理論會議論文摘要)〕。但是,對於漢語的大詞彙集的語音識別,在本發明前,一直還沒有得到解決。目前市場上的中、外文電子打字機,如美國IBM公司的IBM5550多功能中文電腦,中國北京四通集團公司最新推出的MS-2402中、外文電子打字機,都只是通過鍵盤手工操作來輸入漢字。
本發明的目的就是為了解決漢語大詞彙集的語音識別問題,創造出一種操作方便、列印快捷的具有語言直接輸入的漢語聲控電腦打字機。
本發明的漢語聲控電腦打字機的系統方框圖如圖1所示,主要由建立在微型計算機系統基礎上的語言輸入及其識別、中文字詞庫、屏幕顯示和中文印表機等部分組成。其基本工作過程如下首先檢測出語言信號中音節的端點,並找出音節中聲母與韻母的分界點,然後分別對聲母部分和韻母部分作聲母分類識別和韻母及聲調識別,識別出的聲母、韻母和聲調送到檢索、顯示、列印控制軟體,通過檢索中文字、詞庫找出相應的漢字詞,在屏幕上顯示識別出的漢字並在印表機上列印出來。
一、語音識別語音識別是本發明的最關鍵技術。其根據是漢語語音的每個音節都是由聲母、韻母和聲調三要素組成,採用獨立識別21個聲母、36個韻母、和5個聲調(陰、陽、上、去、輕)的方法,實現了大詞彙集的識別。對語音進行識別之前,首先必須找出語音的起始點和終止點,以區分有聲和無聲情況。語音音節始、終點的位置,主要依據能量和過零率,用硬體電話作實時判決。同時進行聲、韻母的劃分,找出聲、韻母的分界點。
1.聲、韻母的劃分聲母和韻母的分界點是根據聲、韻母的頻域特徵和能量特徵來劃分的。塞音(b、d、g、p、t、k)的能量集中在200Hz以下的頻段擦音(zh、ch、sh、z、c、s、j、q、x、f、h)的高頻能量豐富,1KHz以下不再含有它們的成分;鼻音能量小;元音的能量主要集中在200Hz~1KHz的頻域中。我們用200Hz高通濾波器和1KHz低通濾波器(均採用6階切比雪夫濾波器)組成200Hz~1KHz帶通濾波器來濾除輔音,通過整流和積分求出相應的能量,再通過比較器適當設置門限來找到元音的起始點,這就是聲母、韻母的分界點。
聲、韻母劃分方框圖如圖2所示。語音處理及聲、韻母劃分電路原理圖如圖3a)、圖3b)所示。其工作過程如下集成電路IC1~IC3組成放大器,語音信號由S輸入,經放大器放大後的信號分三路處理,一路經IC4~IC7組成的3.4KHz低通濾波器後,再經IC8組成的跟隨器進入電晶體BG1構成的電平位移電路,然後輸進到模/數(A/D)變換器;第二路是找出音節起始點,放大後的信號經IC9~IC11組成的3階1.5KHz~15KHz的高頻提升電路,使高頻聲母(輔音)信號在此電路得到加強,再經IC12、IC13、IC14分別組成的全波整流器、積分器、比較器。適當調節電位器R42,D點便可輸出音節起始點判斷信號;第三路是找聲、韻母分界點及音節終止點。放大後的信號經由IC15~IC18組成的200Hz切比雪夫高通濾波器和由IC19~IC22組成的1KHz低通濾波器濾波,再經IC23組成的整流器和IC24組成的積分電路,最後經IC25組成的滯後比較器比較,從E點輸出聲、韻母劃分點和音節終止點的控制信號。
2.韻母的識別韻母識別方框圖如圖4所示。其工作過程如下首先對輸入信號求LPC係數(線性預測係數)ai,然後求解代數方程i = 010]]>aiZi=0,(i=0、1、2……10)。從所得的根中很容易地確定其走向,便可對韻母進行分類、識別。漢語韻母總共可分為下列七類第一類全部單元音和三元音韻母/uei/、/iou/的簡化讀法/ui/、/iu/第二類/ai/、/ao/第三類/ia/、/ua/第四類/ei/、/ou/第五類/ie/、/ue/、/uo/第六類/iao/、/uai/第七類/iou/、/uei/同一類中的元素以F2走向為區別特徵。如下面所示,/ai/和/ao/的F1走向是相同的,但F2走向不同。
3.聲母的分類識別漢語聲母分類識別主要根據聲母的平均過零率、時域波形周期性、音長、發音能量變化和聲、韻母過渡音的過零率等特徵把聲母分成不送氣塞音(b、d、g)、送氣塞音(p、t、k)、濁輔音(m、n、l、r)、不送氣塞擦音(z、zh、j)、送氣塞擦音(c、ch、q)和擦音(s、sh、x、f、h)六類。聲母分類識別流程圖如圖5所示,其工作過程如下首先根據音長T分出不送氣塞音(b、d、g),然後根據過零率Cz分出非擦音和擦音;在非擦音中,根據音長T分出(b、d、g)和(m、n、l、r),根據周期性DT分出(m、n、l、r),再根據過渡音的過零率下降率Kc把(b、d、g)與(p、t、k)分開;在擦音中,根據音長T分出(z、zh、j)和(s、sh、x、f、h),再根據發音能量上升率KE把(z、zh、j)、(c、ch、q)和(s、sh、x、f、h)分開。
4.聲調的識別漢語四聲聲調是由基音周期的變化決定的。四聲各聲調對應基音周期變化情況如圖6所示。為識別聲調,必須首先檢測基音周期,我們採用時間彎折(DTW)波形匹配法,通過比較相鄰的兩段信號的相似性來找出基音周期,再根據基音周期Tc隨發音持續時間t的變化來判別四聲各聲調。輕聲則根據能量和音長作出判斷。
二、中文字庫和詞庫中文字庫和詞庫包含有常用的幾千個單字詞和數千條多字詞(可以根據需要適當地增減)。對單字詞的檢索,本詞庫根據詞的用途進行分類,即按人名、地名、常用動詞、常用名詞、常用助詞及介詞和連接詞分類,共分為五大類。以手工輔助的方法按要求在每類中進行檢索,從而減少了模糊檢索時重碼詞的條數。多字詞是根據詞中各字的關係以詞為單位進行檢索,從而減少了同音字詞的出現;字、詞庫具有模糊檢索功能,它根據前面給出的聲母和韻母的模糊識別結果及準確的聲調,快速地檢索出相應的字、詞。語音識別系統對聲母、韻母的識別結果是以模糊子集給出的,這樣經過計算機適當的運算,便可求出按隸屬度大小排列的若干個詞條來,以供操作者選擇。這樣設計的詞庫,大大減少了語音識別系統對識別結果的苛刻要求。為了提高檢索速度,檢索詞庫時採用了樹分類檢索法。字、詞庫的模糊檢索程序流程圖如圖7所示。其工作過程如下首先在約定的內存緩衝區中取出前面語音識別系統存放的聲調、聲母和韻母的識別結果,對單字詞,則根據聲調、聲母類別和韻母找出所有符合聲調及聲、韻母搭配條件的詞檢索碼組成模糊集合R1,按語音識別系統給出的各聲母和韻母的確定程度計算出R1中各詞檢索碼所對應的隸屬度,然後按隸屬度大小排列並選擇隸屬度最大的詞檢索碼送到檢索、顯示、列印子程序;對雙字詞或多字詞,同樣是根據聲調、聲母類別和韻母求出R2或R3,再算出各詞檢索碼的隸屬度,然後按大小排列並選擇隸屬度最大的詞檢索碼送去檢索、顯示、列印子程序;檢索、顯示、列印控制子程序流程圖如圖8a)、圖8b)、圖8c)所示首先確定光標位置,取出前面主程序從R中選出詞檢索碼,求出相應的詞庫(單字詞、雙字詞或多字詞)所在地址,根據檢索碼在詞庫中檢索所有與該組碼符合的詞,如果找到的是唯一的一個詞,則在顯示緩衝區取出相應的漢字機內碼送到屏幕顯示,並根據需要送到印表機列印;如果找到一個以上的詞,則在屏幕重碼選擇顯示區顯示出所有的同碼詞,等待鍵盤選擇輸入後再把選到的詞送去顯示列印;如果找不到一個詞,則從前面主程序的R中選出隸屬度次最大的詞檢索碼,重複上述檢索、顯示、列印過程,如仍找不到一個詞,則認為詞庫中不含有相應的詞,提示操作者並返回主程序。
三、顯示及編輯功能屏幕顯示操作提示和識別出的字、詞,在存在同音字詞時,給出可供操作者選擇的字詞,然後可以用鍵盤輸入所選擇的需要的詞。顯示及編輯功能是由圖8a)、8b)、8c)所示的顯示控制軟體子程序控制而實現的。
四、列印功能在如圖8a)、b)、c)所示的列印控制軟體子程序和中文打字系統的控制下,印表機便將識別出的字、詞列印在紙上。
本發明積極意義是通過採用聲、韻母分開的識別方法和以詞為單位進行模糊檢索,創造性地解決了漢語大詞彙集的識別問題,並通過微型計算機把漢語大詞彙集的語音識別系統與印表機配合,創造出新一代的中文電子打字機-漢語聲控電腦打字機。由於漢語聲控電腦打字機具有快速輸入、操作容易、簡便、列印快速等優點,將必然會被人們很快接受。同時,漢語大詞彙集的語音識別問題的解決,為計算機直接聽懂人類自然語言創造了有利條件。所以本發明對實現計算機快速輸入,對加速信息流通和加快辦公自動化的進程將起到決定性的積極推動作用。
下面對


如下圖1為漢語聲控電腦打字機系統方框圖。
圖2為聲、韻母劃分方框圖。
圖3為語音預處理及聲、韻母劃分電路原理圖。圖中IC1~IC25均為LF347四運放集成電路;BG1為電晶體3DG6;D1~D9為二極體1N4007。
圖4為韻母識別框圖。
圖5為聲母分類識別流程圖。圖中T代表音長、CZ代表平均過零率、DT代表周期性分析、KE代表發音的能量變化上升率、KC代表過渡音過零率下降率。
圖6為各聲調對應基音周期變化圖。圖中Tc為基音周期;t是發音持續時間;1、2、3、4分別代表四聲調。
圖7為字、詞庫模糊檢索程序流程圖。
圖8a)、8b)、8c)為檢索、顯示、列印控制軟體子程序流程圖。
本發明的實施例,只要按照圖1所示的漢語聲控電腦打字機系統方框圖,從話筒(拾音器)輸入語音信號,經由圖3所示的語音預處理及聲、韻母劃分電路圖進行調試、製作的電路板,檢測出語音信號中音節的端點,並找出聲、韻母分界點,再按本發明說明書前面所提供的方法通過軟體控制電腦分別作聲母分類識別和韻母及聲調識別,然後把識別出的聲母、韻母和聲調送到計算機,並通過檢索、顯示、列印控制軟體控制檢索中文字、詞庫找出相應的字、詞,在屏幕上顯示出經識別的漢字,並由印表機列印在紙上。
權利要求
1.一種由端點檢測後用聲、韻母分開的語音識別系統,中文字、詞庫及通過計算機以檢索、顯示、列印控制軟體控制的屏幕顯示、中文印表機共同組成的漢語聲控電腦打字機,其特徵在於具有語音直接輸入,用聲、韻母分開方法進行聲母分類識別和韻母、聲調識別的語音識別系統;以詞為單位進行樹分類法模糊檢索的中文字、詞庫及檢索、顯示、列印控制軟體。
2.權利要求1中所述語音識別系統,其特徵是語言經放大器、高頻提升電路、整流器、積分器、比較器檢測出音節起始點;放大後的語言信號經高通濾波器、低通濾波器、整流器、積分器、滯後比較器找出聲、韻母劃分點和音節終止點;再通過軟體控制電腦分別作聲母分類識別和韻母、聲調識別。
3.權利要求1所述檢索、顯示、列印控制軟體,其特徵是包括有確定光標位置、取出詞檢索碼、求出相應詞庫地址、檢索與該組碼符合的詞並控制屏幕顯示和印表機列印之程序。
全文摘要
本發明一漢語聲控電腦打字機屬語音通訊和電子打字機技術。其主要特徵是語音直接輸入,用聲韻母分開進行聲母、韻母和聲調識別及中文字詞庫以詞為單位進行模糊檢索。本發明創造性地解決了漢語大詞彙集的識別問題,創造出新一代中文電子打字機,它具有快速輸入、操作簡便、列印迅捷等優點。同時漢語大詞彙集的語音識別的解決為計算機直接聽懂人類語言創造了條件,對實現計算機輸入、加速信息流通和辦公自動化進程起到決定性作用。
文檔編號G06K15/02GK1038892SQ88103868
公開日1990年1月17日 申請日期1988年6月22日 優先權日1988年6月22日
發明者徐秉錚, 杜明輝, 鄒蔭榮, 吳立忠, 李海洲, 梁耀榮, 陳穗霞 申請人:華南理工大學

同类文章

一種新型多功能組合攝影箱的製作方法

一種新型多功能組合攝影箱的製作方法【專利摘要】本實用新型公開了一種新型多功能組合攝影箱,包括敞開式箱體和前攝影蓋,在箱體頂部設有移動式光源盒,在箱體底部設有LED脫影板,LED脫影板放置在底板上;移動式光源盒包括上蓋,上蓋內設有光源,上蓋部設有磨沙透光片,磨沙透光片將光源封閉在上蓋內;所述LED脫影

壓縮模式圖樣重疊檢測方法與裝置與流程

本發明涉及通信領域,特別涉及一種壓縮模式圖樣重疊檢測方法與裝置。背景技術:在寬帶碼分多址(WCDMA,WidebandCodeDivisionMultipleAccess)系統頻分復用(FDD,FrequencyDivisionDuplex)模式下,為了進行異頻硬切換、FDD到時分復用(TDD,Ti

個性化檯曆的製作方法

專利名稱::個性化檯曆的製作方法技術領域::本實用新型涉及一種檯曆,尤其涉及一種既顯示月曆、又能插入照片的個性化檯曆,屬於生活文化藝術用品領域。背景技術::公知的立式檯曆每頁皆由月曆和畫面兩部分構成,這兩部分都是事先印刷好,固定而不能更換的。畫面或為風景,或為模特、明星。功能單一局限性較大。特別是畫

一種實現縮放的視頻解碼方法

專利名稱:一種實現縮放的視頻解碼方法技術領域:本發明涉及視頻信號處理領域,特別是一種實現縮放的視頻解碼方法。背景技術: Mpeg標準是由運動圖像專家組(Moving Picture Expert Group,MPEG)開發的用於視頻和音頻壓縮的一系列演進的標準。按照Mpeg標準,視頻圖像壓縮編碼後包

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

本發明涉及一種基於加熱模壓的纖維增強pbt複合材料成型工藝。背景技術:熱塑性複合材料與傳統熱固性複合材料相比其具有較好的韌性和抗衝擊性能,此外其還具有可回收利用等優點。熱塑性塑料在液態時流動能力差,使得其與纖維結合浸潤困難。環狀對苯二甲酸丁二醇酯(cbt)是一種環狀預聚物,該材料力學性能差不適合做纖

一種pe滾塑儲槽的製作方法

專利名稱:一種pe滾塑儲槽的製作方法技術領域:一種PE滾塑儲槽一、 技術領域 本實用新型涉及一種PE滾塑儲槽,主要用於化工、染料、醫藥、農藥、冶金、稀土、機械、電子、電力、環保、紡織、釀造、釀造、食品、給水、排水等行業儲存液體使用。二、 背景技術 目前,化工液體耐腐蝕貯運設備,普遍使用傳統的玻璃鋼容

釘的製作方法

專利名稱:釘的製作方法技術領域:本實用新型涉及一種釘,尤其涉及一種可提供方便拔除的鐵(鋼)釘。背景技術:考慮到廢木材回收後再加工利用作業的方便性與安全性,根據環保規定,廢木材的回收是必須將釘於廢木材上的鐵(鋼)釘拔除。如圖1、圖2所示,目前用以釘入木材的鐵(鋼)釘10主要是在一釘體11的一端形成一尖

直流氧噴裝置的製作方法

專利名稱:直流氧噴裝置的製作方法技術領域:本實用新型涉及ー種醫療器械,具體地說是ー種直流氧噴裝置。背景技術:臨床上的放療過程極易造成患者的局部皮膚損傷和炎症,被稱為「放射性皮炎」。目前對於放射性皮炎的主要治療措施是塗抹藥膏,而放射性皮炎患者多伴有局部疼痛,對於止痛,多是通過ロ服或靜脈注射進行止痛治療

新型熱網閥門操作手輪的製作方法

專利名稱:新型熱網閥門操作手輪的製作方法技術領域:新型熱網閥門操作手輪技術領域:本實用新型涉及一種新型熱網閥門操作手輪,屬於機械領域。背景技術::閥門作為流體控制裝置應用廣泛,手輪傳動的閥門使用比例佔90%以上。國家標準中提及手輪所起作用為傳動功能,不作為閥門的運輸、起吊裝置,不承受軸向力。現有閥門

用來自動讀取管狀容器所載識別碼的裝置的製作方法

專利名稱:用來自動讀取管狀容器所載識別碼的裝置的製作方法背景技術:1-本發明所屬領域本發明涉及一種用來自動讀取管狀容器所載識別碼的裝置,其中的管狀容器被放在循環於配送鏈上的文檔匣或託架裝置中。本發明特別適用於,然而並非僅僅專用於,對引入自動分析系統的血液樣本試管之類的自動識別。本發明還涉及專為實現讀