語音識別系統的製作方法

2023-05-18 00:53:01 5

專利名稱：語音識別系統的製作方法
技術領域：
本公開涉及一種使得用戶能夠通過語音來至少部分地操作車載設備的語音識別系統。
背景技術：
已知的語音識別系統將輸入語音與預存儲的比較候選進行比較，並且輸出具有高的符合度的比較候選作為識別結果。近年來，提出了一種使得用戶能夠通過語音在不必用手操作的系統中輸入電話號碼的語音識別系統(參見對應於us 2007/0294086A的JP-2007-256643A)。此外，公開了一種用於通過有效地使用語音識別結果來方便用戶操作的方法(參見 JP-2008-14818A)。由於這些語音識別技術的採用可以減少按鈕操作等，因此，駕駛車輛的駕駛員可以使用確保安全的語音識別。即，如果駕駛員他自己或她自己使用語音識別，則優點變得特別顯著。在傳統的語音識別系統中，在執行語音操作(也稱作「語音命令控制」)的情況下，要求特定於語音操作的操作。例如，雖然某些系統可能允許基於按等級排列的列表顯示的手動操作，但是，手動操作和語音操作通常是分離的。不同於手工操作，語音操作很難理解。

發明內容
鑑於前述內容做了本公開。本公開的目的是提供一種可以融合列表的手動操作和列表的語音操作並且改善可用性的語音識別系統。根據本公開的示例，語音識別系統包括用於在語音識別中使用的識別字典和被配置成通過使用識別字典來識別輸入語音的控制器。控制器被配置成執行話音活動檢測處理、識別處理和列表處理。在話音活動檢測處理中，控制器基於輸入語音的信號電平來檢測語音段。在識別處理中，在在話音活動檢測處理中檢測到語音段的情況下，控制器通過使用識別字典來識別對應於語音段的語音數據。在列表處理中，控制器顯示識別處理的識別結果和列表形式的對應於識別結果的相應項目。以列表形式顯示的相應項目是能夠手動操作的。根據以上配置，語音識別系統可以融合列表的手動操作和列表的語音操作，並且可以改善可用性。

根據參考附圖給出的以下詳細描述，本公開的以上和其他目的、特徵和優點將變得更加明白。在附圖中圖I是示出語音識別系統的框圖；圖2是示出語音識別處理的流程圖；圖3是示出語音信號的圖4是示出列表顯示處理的流程圖；圖5是示出手動操作處理的流程圖；圖6A至6F是每個示出列表顯示的圖；以及圖7是示出列表顯示中的可操作圖標的圖。
具體實施例方式下面將描述實施例。圖I是示出一個實施例的語音識別系統I的框圖。語音識別系統I被安裝至車輛並且包括整體控制語音識別系統I的控制器10。控制器10包括具有中央處理單元(CPU)、只讀存儲器(ROM)、隨機存取存儲器(RAM)、輸入/輸出(I/O)和連接上述部件的總線線路的計算機。
·
控制器10與語音識別單元20、一組操作開關30和顯示單元40連接。語音識別單元20包括語音輸入裝置21、語音存儲裝置22、語音識別裝置23和顯示確定裝置24。語音輸入裝置21被設置成輸入語音，並且與麥克風50連接。將輸入到語音輸入裝置21並且被語音輸入裝置21切割的語音作為語音數據存儲在語音存儲裝置22中。語音識別裝置23執行對存儲在語音存儲裝置22中的語音數據的識別。具體地，通過參考識別字典25，語音識別裝置23將語音數據與預存儲的比較候選進行比較，從而根據比較候選獲得識別結果。識別字典25可以是存儲比較候選的專用字典。在本實施例中，沒有對比較候選進行分組等。將語音數據與存儲在識別字典中的所有比較候選進行比較。基於通過語音識別裝置23獲得的識別結果，顯示確定裝置24確定對應於識別結果的相應項目。準備對應於識別結果的相應項目，作為相應項目列表26。可以根據相應項目列表26來識別對應於每個識別結果的相應項目。用戶能夠手動操作一組操作開關30。顯示單元40可以包括例如液晶顯示器。顯示單元40向用戶提供信息。將描述本實施例的語音識別處理。由控制器10來執行語音識別處理。響應於通過一組操作開關30進行的預定操作，控制器10執行語音識別處理。首先，在SlOO處，控制器10顯示初始畫面。在該步驟中，在顯示單元40上顯示初始列表顯示。具體地，如圖6A所示，在畫面的上部顯示顯示「聽」，並且此外，在顯示「聽」下面顯示語音識別候選中的一部分語音識別候選。在圖6A中，顯示了四個項目「空氣調節器」、「音樂」、「電話」和「搜索周邊」。在SllO處，控制器10執行手動操作處理。在本實施例中，可以並行執行語音操作和手動操作。在語音識別處理期間，重複執行手動操作處理。稍後將描述手動操作處理的細節。在S120處，控制器10確定是否出現了語音段。具體地，控制器10確定電平大於或等於閾值的信號是否經由麥克風50被輸入到語音輸入裝置21。如果控制器10確定出現了語音段，對應於在S120處為是，則處理繼續進行至S130。如果控制器10確定沒有出現語音段，對應於在S120處為否，則處理返回S110。如果檢測到語音段，則在S130處，控制器10獲取語音。具體地，輸入到語音輸入裝置21的語音被獲取，並且被放到緩存等中。在S140處，控制器10確定是否檢測到第一非語音段(也稱為第一無語音段)。在本實施例中，將其間經由麥克風50輸入到語音輸入裝置21的信號的電平低於閾值的區段定義為非語音段。非語音段包括例如由於車輛的行進而導致的噪音。在S140處，如果非語音段持續預定時間Tl，則該非語音段被確定為第一非語音段。如果控制器10確定檢測到了第一非語音段，對應於在S140處為是，則處理繼續進行至S150。在S150處，控制器10將在S130處獲得的語音作為語音數據記錄在語音存儲裝置22中。如果控制器10確定沒有檢測到第一非語音段，對應於在S140處為否，則處理返回S130以重複S130和隨後的步驟。在以上步驟中，如果語音段在進行中，或者還沒有持續預定時間Tl的非語音段在進行中，則控制器10確定沒有檢測到第一非語音段。在S150之後，處理繼續進行至S160。在S160處，控制器10確定是否檢測到第二非語音段(也稱為第二無語音段)。在本實施例中，持續第二預定時間T2的非語音段被確定為第二非語音段。如果控制器10確定檢測到了第二非語音段，對應於在S160處為是，則處理繼續進行至S170。如果控制器10確定沒有檢測到第二非語音段，對應於在S160處為否，則處理返回SllO以重複SllO和隨後的步驟。
現在，給出關於存儲語音數據的說明。圖3是示意性地示出經由麥克風50輸入的語音的信號的圖。在時間tl處，使用一組操作開關30來指示語音操作的開始。在圖3所示的示例中，從時間t2到時間t3的區段被確定為語音段A(在S120處為是)。只要確定沒有檢測到第一非語音段Tl (在S140處為否)，則獲取語音(S130)。如果確定檢測到了第一非語音段Tl(在S140處為是)，則記錄對應於語音段A的語音數據(S150)。此後，只要確定沒有檢測到第二非語音段T2 (在S160處為否)，則重複SllO和隨後的步驟。在圖3所示的示例中，從時間t4到時間t5的區段被確定為語音段B (在S120處為是)，並且記錄對應於語音段B的語音數據(S150)。此後，如果確定檢測到第二非語音段T2 (在S160處為是)，則執行識別處理(S170)。因此，在圖3所示的示例中，對應於語音段A和語音段B兩個語音段的語音數據是識別處理的對象。在本實施例中，可以將多個語音數據作為識別處理的對象。描述返回圖2。在S170處，控制器10執行識別處理。在該識別處理中，將在S150處記錄在語音存儲裝置22中的語音數據與識別字典25中的比較候選進行比較，並且從而，獲得對應於語音數據的識別結果。在S180處，控制器10執行列表處理。圖4是示出列表處理的流程圖。首先，在S181處，控制器10確定是否存在識別結果。在該步驟中，確定在S170處的識別處理中是否已經獲得了任何識別結果。如果控制器10確定存在識別結果，對應於在S181處為是，則處理繼續進行至S182。如果控制器10確定不存在識別結果，即，如果在S170處沒有識別出語音(對應於在S181處為否)，則控制器10結束列表處理，而不執行隨後的步驟。在S182處，控制器10顯示識別結果。在該步驟中，在顯示單元40上顯示S170處的識別結果。在S183處，控制器10顯示相應項目。通過參考相應項目列表26，顯示確定裝置24確定與語音識別裝置23給出的識別結果對應的相應項目。具體地，在S183處，控制器10使得顯示單元40顯示通過顯示確定裝置24確定的相應項目。描述返回圖2。在S190處，控制器10確定是否存在確認操作。如果控制器10確定存在確認操作(在S190處為是)，則語音識別處理結束。如果不存在確認操作，則重複SllO和隨後的步驟。現在，將更加具體地描述圖2中的SllO處的手動操作處理。圖5是示出手動操作處理的流程圖。如上所述，在本實施例中，重複執行手動操作處理，使得手動操作可以與語音操作並行執行。在Slll處，控制器10確定是否執行手動操作。在該步驟中，例如，控制器10確定是否通過一組操作開關30來執行按鈕操作。如果控制器10確定執行手動操作(在Slll處為是)，則處理繼續進行至S112。如果控制器10確定不執行手動操作(在Slll處為否)，則手動操作處理結束。在SI 12處，控制器10確定是否執行選擇操作。在該步驟中，控制器10確定是否執行選擇顯示的相應項目的選擇操作。如果控制器10確定執行選擇操作(在S112處為是)，則處理繼續進行至S113。如果控制器10確定不執行選擇操作(在S112處為否)，則控制器10結束手動操作處理，而不執行隨後的步驟。在SI 13處，控制器10顯示作為被選擇的相應項目的選擇項目。在顯示單元40上顯示選擇項目，如在識別結果中的情況一樣。在S114處，控制器10在顯示單元40上顯示對應於選擇項目的相應項目。為了便於理解上述語音識別處理，將更具體地描述列表顯示。圖6A至6F是每個示出列表顯示的圖。例如，初始列表顯示是如圖6A所示的這樣的列表顯示(S100)。如圖6B所示，如果S170處的識別處理的識別結果為「音樂」，則顯示識別結果「音樂」;此外，通過S180處的列表處理來顯示對應於音樂的一組相應項目「藝術家A」、「藝術家B」、「藝術家C」和「藝術家D 」。在以上步驟中，只要不存在確認操作(在S190處為否)，則允許進一步的語音操作。如圖6C所示，如果S170處的識別處理的識別結果為「藝術家A」，則顯示識別結果「藝術家A」 ;此外，通過S180處的列表處理來顯示對應於藝術家A的一組相應項目「曲目A」、「曲目B」、「曲目C」和「曲目D」。如圖6D所示，如果S170處的識別處理的識別結果為「空氣調節器」，則顯示識別結果「空氣調節器」;此外，在S180處的列表處理中顯示對應於空氣調節器的一組相應項目「溫度」、「風量」、「內部循環」和「外部空氣引入」。在以上步驟中，只要不存在確認操作(在S190處為否)，則允許進一步的語音操作。如圖6E所示，如果S170處的識別處理的識別結果為「溫度」，則顯示識別結果「溫度」;此外，通過S180處的列表處理來顯示一組相應項目「25°C」、「27°C」、「27. 5°C」和「28°C」。如圖6F所示，如果發出了進一步的語音，並且S170處的識別處理的識別結果為「25°C」，則顯示識別結果「25°C」 ;此外，在S180處的列表處理中顯示對應於25°C的一組相應項目「25. 5°C」、「27°C」、「27. 5°〇」和「28°〇」。關於「25°C 」顯示其他溫度候選的原因是即使發生錯誤的識別，用戶也可以迅速地選擇其他溫度。在本實施例中，只要不存在確認操作(在S190處為否)，則重複執行手動操作處理(SI 10)。因此，也可以通過手動操作來實現上述列表顯示。例如，如圖6B所示，如果語音識別結果為「音樂」，則顯示對應於音樂的一組相應項目「藝術家A」、「藝術家B」、「藝術家C」和「藝術家D」。如圖6C所示，在這種情況下，如果通過一組操作開關30執行了選擇「藝術家A」的選擇操作(手動操作)(在S112處為是)，則顯示所選擇的項目「藝術家A」(S113);此外，顯示對應於藝術家A的一組相應項目「曲目A」、「曲目B」、「曲目C」和「曲目D」 (SlH)0
可知，可以通過語音操作或手動操作來顯示相同的列表顯示。在本實施例中，不管列表顯示，語音識別裝置23將語音數據與存儲在識別字典中的所有比較候選進行比較。因此，即使顯示圖6A所示的列表顯示，也可以識別除四個項目「空氣調節器」、「音樂」、「電話」和「搜索周邊」以外的語音(例如，藝術家A、藝術家B)。因此，如果藝術家A為識別結果，則提供圖6C所示的列表顯示。同樣地，即使顯示圖6C所示的列表顯示，也可以識別除四個項目「藝術家A」、「藝術家B」、「藝術家C」和「藝術家D」以外的語音(例如，空氣調節器、溫度)。因此，如果空氣調節器為識別結果，則提供圖6D所示的列表顯示，而如果溫度為識別結果，則提供圖6E所示的列表顯示。在本實施例中，可以將多個語音數據作為單個識別處理的對象。因此，如果在執行語音識別之前，換言之，在檢測到非語音段T2之前(在S160處為否)，發出「音樂」並且之後發出「藝術家Al」，則顯示圖6C所示的列表顯示而不顯示圖6B所示的列表顯示。這樣做是為了遵循用戶意圖。具體地，如果用戶發出「音樂」並且此後發出「藝術家A」，則能想到用戶意圖是聽「音樂」中的「藝術家A」的具體樂曲。在另外的示例中，如果在執行語音識別之前，換言之，在檢測到非語音段T2之前(在S160處為否)，發出「音樂」並且之後發出「空氣調節器」，則將優先權給予後面的「空氣調節器」，並且顯示圖6所示的列表顯示。這樣做是為了對用戶的重新陳述作出反應。具體地，例如，如果用戶發出「音樂」並且此後發出「空氣調節器」，則能想到雖然已經說過「音樂」，但是用戶最終想要操作空氣調節器。可以通過與例如列表顯示平衡來設計在將多個語音數據作為識別對象的情況下的顯示形式。將描述本實施例的語音識別系統I的優點。在本實施例中，基於輸入語音的信號電平來確定(檢測)語音段(S120至S140)，並且記錄(S150)並識別(S170)對應於語音段的語音數據。此後，顯示識別結果和對應於識別結果的列表(S180、S182、S183)。在這種情況下，只要不存在確認操作(在S190處為否)，則重複執行話音活動檢測，同時允許相應項目的顯示列表的手動操作(S110)。換言之，在本實施例中，重複執行話音活動檢測，直到按下確認按鈕等。因此，重複執行語音識別和對應於識別結果的列表顯示。因此，即使在沒有發生識別或發生了錯誤的識別的情況下，用戶仍可以重複地發出語音，而不需要在發出之前的按鈕操作。此外，由於自動檢測語音段，因此，對發出時間選擇沒有限制。此外，由於以列表形式顯示對應於識別結果的相應項目，並且由於列表也能夠通過手動操作來操作，所以，語音操作可以與手動操作並行執行，並且因此，語音操作變得容易理解。因此，語音識別系統可以融合手動操作和語音操作，並且可以提供高的可用性。在本實施例中，如果執行手動操作(在Slll處為是)，並且選擇了相應項目(在S112處為是)，則顯示所選擇的項目(S113)並且顯示對應於所選擇的項目的相應項目列表(SlH)0如果發出了指示圖6B所示的相應項目「藝術家A」、「藝術家B」、「藝術家C」和「藝術家D」中的「藝術家A」的語音，則顯示藝術家A以及對應於藝術家A的相應項目「樂曲A」、「樂曲B」、「樂曲C」和「樂曲D」的列表。同樣地，如果手動選擇了圖6B所示的相應項目「藝術家A」、「藝術家B」、「藝術家C」和「藝術家D」中的「藝術家A」，則顯示藝術家A以及對應於藝術家A的相應項目「樂曲A」、「樂曲B」、「樂曲C」和「樂曲D」的列表。可知，響應於手動操作和語音操作兩者提供了同樣的列表顯示。因此，容易理解語音操作。
此外，在本實施例中，以列表形式顯示的相應項目是存儲在識別字典25中的比較候選中的一部分比較候選。在圖6B所示的示例中，「藝術家A」、「藝術家B」、「藝術家C」和「藝術家D」是比較候選中的一部分比較候選。因此，通過查看列表顯示，用戶可以從被顯示為列表的相應項目中選擇接下來要發出的語音。因此，語音操作變得容易理解。本實施例將輸入語音與所有比較候選進行比較，而不管以列表形式顯示的相應項目。例如，如果在圖6B所示的狀態下發出了指示沒有包括在列表顯示中的「空氣調節器」的語音，則可以識別語音「空氣調節器」，並且因此，顯示識別結果「空氣調節器」以及對應於識別結果的相應項目「溫度」、「風量」、「內部循環」和「外部空氣引入」的列表。以這種方式，本實施例使得能夠執行高度靈活的語音操作。此外，在本實施例中，控制器10通過確定(檢測)非語音段來檢測語音段，非語音段是其間語音的信號電平低於閾值的區段。具體地，控制器10通過檢測第一非語音段來檢測語音段(在S140處為是和S150)。在檢測到第二非語音段之前，控制器(10)重複檢測第一非語音段以檢測語音段，從而獲得多個語音段(在S160處為否、S120至S150)。此後，控制器10識別相應地對應於多個語音段的多個語音數據(S170)。因此，控制器10 —次可以識別多個語音數據。這擴展了語音操作多樣性。在本實施例中，步驟S120至S160可以對應於話音活動檢測處理。S170可以對應於識別處理。S180，包括S181至S183，可以對應於列表處理。實施例不限於上述示例，而是可以具有各種形式。在以上實施例中，只要不存在確認操作，就重複執行語音識別(在S190處為否、S170)。此外,確認操作是通過例如一組操作開關30來輸入的手動操作。可替換地,確認操作可以是通過語音來輸入的語音操作。此外，語音識別系統可以被配置成在手動操作發生時結束語音識別，而不是在S190處的確認操作發生時結束語音識別。在這種情況下，在S180之後，處理可以繼續進行至S110，並且語音識別處理可以響應於Slll處為是而結束。在以上實施例中，描述了圖6A至6F中的列表顯示作為示例。可替換地，如果語音識別系統被配置成在手動操作發生時結束語音識別，則可以使用如圖7所示的具有可操作圖標的列表顯示。在這種情況下，用戶可以通過使用安裝到方向盤等的操作按鈕選擇圖標來執行手動操作。圖7所示的示例假設上操作按鈕、下操作按鈕、左操作按鈕和右操作按鈕被安裝到方向盤等。在這種情況下，上操作按鈕和下操作按鈕可以用於選擇通風模式；左操作按鈕可以用於變換為風量調節模式；而右操作按鈕可以用於變換為溫度調節模式。S卩，如果設置有使用操作圖標的列表顯示，則通過手動操作來執行對列表的相應項目的下一個選擇。因此，可以優選的是，在手動操作時結束語音識別。在以上實施例中，使用預存儲有比較候選的專用字典作為識別字典25。可替換地，可以使用通用字典作為識別字典25。通用字典可以不對具體發出的語音造成限制。本公開有各個方面。例如，根據一個方面，語音識別系統可以如下進行配置。語音識別系統包括用於在語音識別中使用的識別字典(25)和被配置成通過使用識別字典(25)來識別輸入語音的控制器(10)。控制器(10)被配置成執行話音活動檢測處理、識別處理和列表處理。在話音活動檢測處理中，控制器(10 )基於輸入語音的信號電平來檢測語音段。在識別處理中，如果在話音活動檢測處理中檢測到語音段，則控制器(10)通過使用識別字典
(25)來識別對應於語音段的語音數據。在列表處理中，控制器(10)顯示識別處理的識別結果和列表形式的對應於識別結果的相應項目。以列表形式顯示的相應項目能夠手動操作。圖6A至6F示出了以列表形式顯示的相應項目的示例。例如，如果顯示了圖6A所示的初始畫面並且發出語音「音樂」，則顯示識另Ij結果「音樂」以及對應於識別結果的相應項目「藝術家A」、「藝術家B」、「藝術家C」和「藝術家D」的列表。以上相應項目能夠手動操作。例如，以上相應項目能夠手動選擇。更具體地，根據以上語音識別系統，由於對應於識別結果的相應項目以列表形式顯示並且能夠手動操作，因此，語音操作和手動操作能夠並行執行。因此，語音操作容易理解。以這種方式，語音識別系統融合手動操作和語音操作，並且提供高的可用性。
應當注意，傳統的語音識別系統通常要求用戶在發出語音之前操作按鈕。按鈕的操作觸發語音識別。在以上傳統的語音識別系統中，每次沒有發生識別或發生了錯誤的識別的時候，用戶需要操作按鈕。此外，用戶需要在操作按鈕之後立即發出語音。這對發出時刻造成了限制。鑑於上述問題，可以重複執行話音活動檢測處理，直到檢測到預定操作。例如，重複執行話音活動檢測處理，直到按下確認按鈕等。結果，重複執行識別處理和列表處理。因此，即使沒有發生識別或發生了錯誤的識別，用戶可以重複地發出語音而無需在發出語音之前操作按鈕。即，可以除去在發出之前的按鈕的操作。此外，由於自動檢測語音段，因此，對發出時刻沒有限制。以這種方式，語音識別系統增強了可用性。以與響應於語音操作基本相同的方式響應於手動操作來顯示列表是方便的。有鑑於此，以上語音識別系統可以被配置成使得響應於通過手動操作進行的相應項目的選擇，控制器(10)顯示作為所選擇的相應項目的選擇項目和列表形式的對應於選擇項目的相應項目。例如，如果用戶說出了圖6B所示的相應項目「藝術家A」、「藝術家B」、「藝術家C」和「藝術家D」中的「藝術家A」，則如圖6C所示，顯示藝術家A以及對應於藝術家A的相應項目「樂曲A」、「樂曲B」、「樂曲C」和「樂曲D」的列表。類似地，如果用戶手動選擇了圖6B所示的相應項目「藝術家A」、「藝術家B」、「藝術家C」和「藝術家D」中的「藝術家A」，則如圖6C所示，顯示藝術家A以及對應於藝術家A的相應項目「樂曲A」、「樂曲B」、「樂曲C」和「樂曲D」的列表。以這種方式，可以響應於手動操作和響應於語音操作來顯不同一列表。語音操作變得容易理解。能想到可以採用所謂的「通用字典」作為識別字典。但是，使用存儲有比較候選的專用字典可以提高成功識別率。假設使用專用字典，則識別字典(25)可以存儲預定的比較候選，並且相應項目可以是預定的比較候選中的一部分。例如，在圖6B所示的情況下，相應項目「藝術家A」、「藝術家B」、「藝術家C」和「藝術家D」是比較候選中的一部分比較候選。在這種情況下，由於以列表形式顯示的相應項目是比較候選中的一部分比較候選，所以用戶可以看到顯示列表以從所顯示的比較候選中選擇語音。以這種方式，語音操作變得容易理解。此外，假設使用專用字典，則控制器(10)可以將語音數據與所有預定的比較候選進行比較，而不管以列表形式顯示的相應項目。在該配置中，控制器(10)不僅將語音數據與被顯示為列表的比較候選進行比較，而且還將語音數據與沒有被顯示為列表的比較候選進行比較。例如，如果顯示圖6A所示的初始畫面並且發出了語音「音樂」，則顯示識別結果「音樂」以及對應於識別結果的相應項目「藝術家A」、「藝術家B」、「藝術家C」和「藝術家D」的列表。在這種情況下，如果發出了沒有在列表中顯示的語音「空氣調節器」，則可以識別語音「空氣調節器」，並且因此，顯示識別結果「空氣調節器」以及對應於識別結果的相應項目「溫度」、「風量」、「內部循環」和「外部空氣引入」的列表。以這種方式，可以實現非常靈活的語音操作。如上所述，預定操作的示例是確認按鈕的按下。即，預定操作可以是預定的確認操作。應當注意，例如，預定的確認操作不僅包括確認按鈕的按下，還包括語音操作，如語音「確認」的發出。預定操作可以是通過列表處理以列表形式顯示的相應項目的手動操作。在這種情況下，在手動操作發生時，可以結束語音識別處理。採用任意上述配置可以使得用戶即使在沒有發生識別和發生了錯誤的識別的情況下仍然能夠重複地發出語音來輸入語音。可以除去在發出之前的按鈕的用戶操作。此外，由於自動檢測語音段，因此，對發出時刻沒有限制。顯示列表可以是如圖6A至6F所示的比較候選的列表。可替換地，以列表形式顯示的相應項目可以顯示為可操作圖標。例如，可以將以列表形式顯示的相應項目顯示為如圖7所示的可操作圖標。這便於手動操作並且使得語音操作能夠平穩過渡到手動操作。對於話音活動檢測處理，以上語音識別系統可以如下配置。在話音活動檢測處理中，控制器(10)通過檢測非語音段來檢測語音段，非語音段是其間輸入語音的信號電平低於閾值的區段。在該配置中，可以相對容易地檢測語音。以上語音識別系統可以如下配置。非語音段包括第一非語音段和比第一非語音段長的第二非語音段。在話音活動檢測處理中，在檢測到第二非語音段之前，控制器(10)通過檢測第一非語音段來重複檢測語音段，從而獲得多個語音段。在識別處理中，控制器(10)識別相應地對應於多個語音段的多個語音數據。在識別處理中，可以識別對應於多個語音段的多個語音數據。因此，可以一次識別多個語音數據。這擴展了語音操作多樣性。雖然參考本公開的實施例描述了本公開，然而，應當理解，本公開不限於這些實施例和結構。本公開意在覆蓋各種更改和等同布置。此外，雖然上述各種組合和配置在本公開的精神和範圍內，但是，包括更多元件、更少元件或僅單個元件的各種其他組合和配置也在本公開的精神和範圍內。
權利要求
1.一種語音識別系統，包括識別字典(25 )，所述識別字典(25 )用於在語音識別中使用；以及控制器(10)，所述控制器(10)被配置成通過使用所述識別字典(25)來識別輸入語音，其中，所述控制器(10)被配置成執行話音活動檢測處理，用於基於所述輸入語音的信號電平來檢測語音段，識別處理，用於在在所述話音活動檢測處理中檢測到所述語音段的情況下通過使用所述識別字典(25)來識別對應於所述語音段的語音數據，以及列表處理，用於顯示所述識別處理的識別結果以及列表形式的對應於所述識別結果的相應項目，其中，以列表形式顯示的所述相應項目能夠手動操作。
2.根據權利要求I所述的語音識別系統，其中所述話音活動檢測處理被重複執行，直到檢測到預定操作。
3.根據權利要求I所述的語音識別系統，其中響應於通過手動操作進行的所述相應項目的選擇，所述控制器(10)顯示作為被選擇的相應項目的選擇項目；以及列表形式的對應於所述選擇項目的所述相應項目。
4.根據權利要求I所述的語音識別系統，其中所述識別字典(25)存儲預定的比較候選；以及所述相應項目是所述預定的比較候選中的一部分。
5.根據權利要求I所述的語音識別系統，其中所述識別字典(25)存儲預定的比較候選；以及在所述識別處理中，所述控制器(10)將所述語音數據與全部所述預定的比較候選進行比較，而不管以列表形式顯示的所述相應項目。
6.根據權利要求I所述的語音識別系統，其中所述預定操作是預定的確認操作。
7.根據權利要求I所述的語音識別系統，其中所述預定操作是通過所述列表處理以列表形式顯示的所述相應項目的手動操作。
8.根據權利要求I所述的語音識別系統，其中以列表形式顯示的所述相應項目能夠顯示為可操作圖標。
9.根據權利要求I至8中的任一項所述的語音識別系統，其中在所述話音活動檢測處理中，所述控制器(10)通過檢測非語音段來檢測所述語音段，所述非語音段是其間所述輸入語音的信號電平低於閾值的區段。
10.根據權利要求9所述的語音識別系統，其中所述非語音段包括第一非語音段和比所述第一非語音段長的第二非語音段；在所述話音活動檢測處理中，在檢測到所述第二非語音段之前，所述控制器(10)通過檢測所述第一非語音段來重複檢測所述語音段，從而獲得多個語音段；以及在所述識別處理中，所述控制器(10)識別相應地對應於所述多個語音段的多個語音數據。
全文摘要
本發明公開了一種語音識別系統，該語音識別系統包括用於在語音識別中使用的識別字典和被配置成通過使用識別字典來識別輸入語音的控制器。控制器基於輸入語音的信號電平來檢測語音段、通過使用識別字典來識別對應於語音段的語音數據並且顯示識別處理的識別結果和列表形式的對應於識別結果的相應項目。以列表形式顯示的相應項目能夠手動操作。
文檔編號G10L15/18GK102867510SQ20121023306
公開日2013年1月9日申請日期2012年7月5日優先權日2011年7月7日
發明者藤澤友紀, 淺見克志申請人:株式會社電裝

首页

算命

星座

感情

婚姻

風水

文化

生活

生肖

百科

解夢

娛樂

社會

語音識別系統的製作方法

一種新型多功能組合攝影箱的製作方法

壓縮模式圖樣重疊檢測方法與裝置與流程

個性化檯曆的製作方法

一種實現縮放的視頻解碼方法

基於加熱模壓的纖維增強PBT複合材料成型工藝的製作方法

一種pe滾塑儲槽的製作方法

釘的製作方法

直流氧噴裝置的製作方法

新型熱網閥門操作手輪的製作方法

用來自動讀取管狀容器所載識別碼的裝置的製作方法