全局語音操控 車載一體機的尚方寶劍
2025-01-24 22:07:11 1
泡泡網GPS頻道1月22日 過去的一年,圍繞汽車與網際網路發生了幾件大事。
iOS in the Car橫空出世,將蘋果氣質植入汽車中控;Tesla風潮席捲全球,17寸中控大屏同樣貴氣十足。新年伊始,Google攜奧迪等車廠之力組建OAA開放汽車聯盟,誓要一洗行業頹靡之氣,打造卓越車內生活體驗。一時間江湖群雄四起,汽車上的這塊「第四屏」無疑將成為今年的行業熱點。
然而車載屏幕終究不同於傳統屏幕。人們在使用手機、平板、電腦時所處環境是安全的,可以專注於屏幕內容,但車載屏幕必須考慮用戶駕車使用時的安全性,這意味著需要在交互上下苦工,以提升駕駛時的操作精度並儘量減少對用戶的精力分散程度。
這也正是巨頭正在著力突破的地方,但歸根究底,靠優化「觸控交互」是不足以真正保障安全的,非常好的的解決方案應當是「語音交互」——用戶無需分心去看屏幕,只要講話就能實現所有功能,既確保安全性,也提升效率。iOS in the Car主打用類似Siri的方式完成操控,其用意也正是如此。
圍繞語音控制這一領域,當前叫得比較響的產品有兩款,其一沃爾沃在今年CES大會上推出的概念車Concept Coupe,儘管主打了Voice Control的理念,但卻並沒有展示任何細節,究竟要如何交互,發出指令是說一句話還是說特定的幾個命令詞完全不知道;另一款是福特與微軟合作推出的SYNC,主要強調了車輛與手機通訊器材的無線通訊,但其語音控制能力仍停留在很初級的階段(比如可以在開車時接收簡訊但想要回復卻必須停車手動操作)。後裝市場上一些所謂的「語音控制」也只是在其產品的局部功能上得到實現。比如想要語音控制某個應用,需要先手動打開它,通過若干步驟進入某個特定的界面,然後輸入語音指令才有效,而此時想要語音控制其他應用就必須手動先退出該應用,再打開新應用才能發出語音指令。發出命令時也需要遵循特定的講話規則,否則它就聽不懂。
究其原因,自然語言處理是一項複雜艱深的技術。首先是語音識別的精確性(如何把講出的話變成一段正確的文字),其次是語義理解的準確性(讓語音助手「理解」這段文字中包含的用戶需求),最後才是提供針對性的動作。要理解人們多樣化的語言指令需要龐大的語料庫作支撐,所以這項技術往往只能聯網實現,想要離線使用,對於語義分析將是一項巨大的挑戰。受制於技術實力,行業上已有的產品只能實現局部語音控制(需要識別的指令相對單一),這樣的解決方案是很不完備的。
但這一難題日前終於被攻克。位於北京的智歌科技團隊成功實現了全局語音控制功能,並且還能在不聯網的情況下使用,這是該項技術在全球範圍內首次運用於車載終端,而智歌也是行業內唯一一家敢做硬體全局語音按鍵的公司(順帶一提,智歌的Boss就是傳說中將Android帶入中國的男人,他在微軟亞洲研究院工作時專攻的就是語音識別和語義理解)。這意味著用戶在任何時間、任何界面環境下都能一鍵呼出語音助手,實現任何一項想要的功能。比如在聽音樂時打開Google檢索歌手信息,在聽廣播時打開百度導航,在無聊時讓語音助手講個故事,或是直接調戲TA……相比之下,其他廠商的「局部語音」每執行一項功能都會多出幾個步驟,也更容易出事故。
1. 聽汪峰的歌時想找他其他的歌,一鍵呼出語音功能並說出「搜索汪峰的歌」:
2. 語音功能識別指令後迅速給出反饋:
3. 自動跳轉到搜索汪峰歌曲的百度頁面
1. 聽收音機時需要使用導航,一鍵呼出語音功能並說出「導航到中國傳媒大學」:
2. 語音功能識別指令後打開百度導航並自動設定線路:
3. 開始導航:
這位名叫「小智」的語音助手也非常聰明,跟他講話不用一板一眼,可以隨著性子來:「給爺來首歌」——「正在為您播放汪峰的《高地》」,「小智我餓了」——「正在查找附近的餐館」,「小智做我女朋友好嘛?」——「親~有空調戲我不如出去找妹子哦」……無論你是小清新還是非主流,是傲嬌黨還是御宅族,小智都懂你。
據悉,該產品已經進入量產期,春節即將投入銷售。■
品牌資料:智歌科技成立於2013年,是一家致力於Android平臺車載互聯一體機產品研發、生產和銷售於一體的高新技術企業。公司擁有強大的自主研發團隊和很強的生產製造能力,對車機和網際網路有深度的理解,注重底層技術和用戶體驗,目前正以「做全世界最好的智能聯網車機」為願景而努力。