一種基於人臉識別和聲紋雲識別的汽車啟動裝置的製作方法
2023-05-10 05:44:31 1

本實用新型涉及汽車領域,尤其是涉及一種基於人臉識別和聲紋雲識別的汽車啟動裝置。
背景技術:
人臉識別,隨著技術的發展,人臉識別已經從單一的臉部圖像特徵識別逐步深化,一方面增加了位置對比(比如左眼角到鼻尖)、光影特徵、虹膜識別等細節,另一方面還會引入3D建模技術以獲取更立體數據特徵來識別身份。
聲紋識別,它是基於人類發聲的生物學特性發展而來的新技術。科學表明,每個人發音講話都是通過鼻腔、口舌、聲道、胸肺幾大器官多重配合的結果,最終形成的看不見的聲波被識別成聲紋圖譜,而任何兩個人的聲紋圖譜跟指紋類似,都不會相同。不同的聲道結構決定了聲紋的唯一性。
而現有的汽車啟動依然通過車主使用車鑰匙對汽車的啟停進行控制,經常發生丟鑰匙和找鑰匙的情況,而一些汽車通過一鍵啟動的方式進行車輛啟停,但是成本很高不利於推廣。
技術實現要素:
本實用新型的目的就是為了克服上述現有技術存在的缺陷而提供一種雙重識別、識別準確、操作簡單、成本低、指紋校對、提高精度的基於人臉識別和聲紋雲識別的汽車啟動裝置。
本實用新型的目的可以通過以下技術方案來實現:
一種基於人臉識別和聲紋雲識別的汽車啟動裝置,該裝置包括:
識別組件:包括麥克風和攝像頭,用以獲取車主的語音信息和面部視頻圖像;
車機組件:用以獲取識別組件的語音信息和面部視頻圖像,並分別進行視頻信號轉換和解碼以及語音信息的壓縮和聲紋信息轉換;
雲伺服器:與車機組件通信,接收解碼後的面部視頻圖像與註冊的面部特徵進行對比識別,並配合接收到的聲紋信息進行相似度識別,並將識別結果返回給車機組件;
ECM:與車機組件通過CAN總線通信,獲取識別結果並進行相應的啟停動作。
所述的車機組件包括視頻轉換器、視頻解碼器、音頻壓縮器和語音識別器,所述的麥克風、視頻轉換器、視頻解碼器和雲伺服器依次連接,所述的攝像頭、音頻壓縮器、語音識別器和雲伺服器依次連接。
所述的麥克風設置在駕駛員頭頂上方的固定位置。
所述的攝像頭設置在儀錶盤下方。
所述的麥克風為降噪麥克風。
所述的攝像頭為高解析度攝像頭。
所述的識別組件還包括一指紋識別器,所述的指紋識別器與車機組件連接
與現有技術相比,本實用新型具有以下優點:
一、雙重識別、識別準確:本實用新型通過語音識別和圖像處理的算法設計,實現了用聲紋和人臉識別雙重驗證來對汽車啟停進行控制,以代替傳統機械點火和一鍵啟動控制方法,識別準確,防止誤操作。
二、操作簡單、成本低:不同於傳統的機械鑰匙點火方式和傳統啟動程序,本實用新型只需要用戶對著車內攝像頭輕輕喊一聲汽車啟停命令即可實現啟動熄火,避免了丟鑰匙、找鑰匙的煩惱,同時相比於傳統鑰匙點火方式和現在市場上高級小轎汽車配備的一鍵啟動按鈕,本設計節省了成本,提高了汽車系統的安全性和用戶體驗。
三、指紋校對、提高精度:本實用新型還通過指紋識別器對人員的指紋進行識別,配合聲紋和人臉識別雙重驗證進行識別,更加提高了識別精度,確保汽車安全啟動。
附圖說明
圖1為本實用新型的結構示意圖。
其中,1、麥克風,2、攝像頭,3、視頻轉換器,4、視頻解碼器,5、音頻壓縮器,6、語音識別器,7、車機組件,8、雲伺服器,9、ECM。
具體實施方式
下面結合附圖和具體實施例對本實用新型進行詳細說明。
實施例:
本實用新型是一種新型的汽車啟停裝置,通過錄入用戶的聲音和採集用戶面部特徵信息來判斷是否操作員為車主用以啟停汽車。
本裝置由以下幾個部分組成,麥克風1,攝像頭2,指紋識別器、視頻處理模塊,語音處理模塊,雲伺服器8組成。其中視頻處理模塊中包含有視頻轉換器3,視頻解碼器4,語音處理模塊中包含有音頻壓縮器5和語音識別器6。
本實用新型的連接方式是,由高解析度攝像頭採集視頻信號後連接到視頻轉換器3,做模數轉換,經過視頻解碼器4後,再連接到雲伺服器8做人臉識別,與註冊的面部特徵信息比對,返回圖像識別結果。降噪麥克風採集用戶輸入語音後連接到音頻壓縮模器5,經過語音識別器6進行語音聲紋信息轉換後,再連接到雲伺服器8做聲紋識別,指紋識別器獲取啟動人員的指紋信息後發送給雲伺服器8做輔助判斷,用戶身份認證結果消息經過CAN網絡傳送至汽車發動機管理系統ECM9。
工作原理如下,高解析度攝像頭,安裝於儀表下方固定位置,在用戶說出汽車啟停命令後發起人臉識別;其視頻信號將通過視頻轉換器3完成模擬數字轉換,再經視頻編解碼傳輸到雲伺服器8,指紋識別器設置在儀錶盤處並獲取啟動人員的指紋信息。
在發出身份認證請求後,攝像頭採集人臉區域圖像,對面部關鍵點標定,包含五官位置,眼睛位置,眉毛位置、鼻子位置及輪廓。通過檢測面部特徵點自動獲得大量像素點。圖像識別引擎計算用戶人臉雲伺服器端存儲的註冊過的人臉模型相似度,計算後得出相似度置信得分並與設定的相似度閥值比較,大於則認為認證成功,反之人臉識別認證失敗。系統會運用機器學習技術提高人臉識別模型的準確度和識別的響應速度。
麥克風1裝在駕駛員頭頂上方固定位置處。車機實時檢測外界聲音輸入,一旦用戶說出專用汽車啟停命令,系統會馬上獲取用戶輸入的錄音數據,並對用戶輸入語音壓縮通過實時網絡傳輸技術傳輸至伺服器端,語音壓縮可以降低對網絡傳輸的帶寬要求,伺服器端實時接收和數據解壓,可以提高用戶註冊和認證的響應速度。語音識別器6接收到語音數據後,對接受的語音數據進行語音識別處理,將語音數據轉換成聲紋信息,伺服器端獲取聲紋特徵向量,並於聲紋模型系統單元內註冊的用戶聲紋數據比對。比較兩者相似度,聲紋相似度大於設定閥值,認證成功,反之認證失敗。在聲紋認證和人臉識別認證都通過後,車機組件7通過CAN網絡給發動機管理系統ECM9發送控制信息,來實現汽車啟停。