捷通華聲發布靈雲語音喚醒技術
2023-07-11 12:38:28
靈雲科技8日消息:捷通華聲宣布推出靈雲語音喚醒技術,可喚醒在休眠的手機、智能家居、智能車載、機器人、智能可穿戴設備等各種智能終端,喚醒率高達96%,從根本上解決了當前智能硬體只能用手打開後再用語音控制的方式。這是繼靈雲遠場識別、靈雲內容平臺發布以來,捷通華聲為智能車載、智能家居、家電等智能終端領域貢獻的又一突破性技術。
靈雲語音喚醒的推出,進一步打破了智能語音控制在智能終端領域應用的產業瓶頸,讓智能終端設備實現語音啟動,一句話打開手機、電腦、電視、車載終端、機器人等智能硬體,使設備脫離了手動控制,實現「語音交互 從『頭』開始」。
靈雲語音喚醒 真正解放雙手
眾所周知,由於功耗等方面的限制,智能電視等終端設備很難24小時都保持在激活狀態。因此,要想自由地控制智能終端設備,我們還需要能即時「喚醒」功能,也就是給智能終端設備加入「語音喚醒」技術。
語音喚醒,是指通過含有特定喚醒詞的語音輸入來「觸發」語音識別系統以實現後續的語音交互。通過該技術,任何人在任何環境、任何時間,無論是近場還是遠場,面向設備直接說出預設的喚醒詞,就能激活產品的識別引擎,從而真正實現全程無觸控的語音交互。
除了說單個喚醒詞實現喚醒外,更自然便捷、在技術上更具有挑戰性的交互方式是在連續語流中帶上喚醒詞,以實現喚醒產品並同時實現操控的效果。
目前,靈雲語音喚醒方案在家居、電視、機器人等智能終端中具有非常廣泛的用途,比如室內電燈關閉時喊一聲:「小靈,開燈。」此時電燈會自動亮起,當離開時喊一聲:「小靈,關燈。」電燈就自動關閉;當你找不到手機時,可以直接通過語音喊出「你好,小靈,你在哪兒」將其喚醒並響鈴,這是其相對基礎、也是比較主要的功能。
靈雲語音喚醒具備當前領先的技術水平,也可用於智能車載設備上。在此之前,智能車載必須手動開機,開機後才能再進行語音交互,而靈雲語音喚醒則將省略開機過程,在通電狀態下直接喊出「小靈,打開車載」車載設備將自動打開並等候下一步指令;在智能家居中,靈雲語音喚醒更是必不可少,電視、冰箱、洗衣機、空調等智能家居設備都需要首先喚醒才能實現語音交互功能;而機器人的即問即答則更是少不了喚醒的功能。
靈雲智能語音 一站式語音交互解決方案
隨著國內外巨頭們對語音交互領域投入的增加,語音核心技術正逐步成熟。智能終端作為 IT 產業和製造工業向個人用戶領域滲透發展的必然結果,語音技術正不斷進入智能終端領域滲透,市場前景廣闊。語音交互對於智能終端最直接的意義在於將「智能終端」變得真正的智能起來。無論是再技術先進的品牌,再友善的人機互動界面,都沒有語音交互控制來的簡便直接。所有品牌、所有產品以一個智能控制的概念進駐到人們息息相關的日常生活中的時候,少不了需要一個學習和適應的過程,而語音則不需要,我們所有的日常交流、行為習慣,語言和聲音已經成了人們思維中的一部分。所以,如果智能終端能與語音交互融於一體,那麼智能終端產業也許會迎來一次劃時代的突破。
但很長一段時間以來,科大訊飛、NUANCE等語音技術公司都在努力開拓智能硬體市場,但智能硬體產品在很多場景下因語音交互體驗不如人意而不能滿足市場的需求,究其原因主要是受限於手動開啟、背景噪音、回聲、混響、交互內容空洞等多重複雜因素,進而導致的識別距離近、識別率低等明顯痛點,在這些問題沒有解決之前,智能硬體語音交互方面將一直是一個短板。鑑於此,捷通華聲推出了包括靈雲語音喚醒、靈雲遠場語音識別、靈雲智能語音、靈雲智能語義、靈雲內容平臺在內的靈雲智能終端解決方案,該套解決方案為國內最全、最完整的智能語音交互解決方案,必將極大促進智能語音交互技術在真實生活場景中智能終端的應用。
智能終端首先需要由靈雲語音喚醒來「叫醒」,才能進一步交互,沒有被「叫醒」功能的終端將無法繼續使用語音交互來控制。當設備被叫醒後,靈雲遠場語音識別能力將顯示它巨大的威力,可以想像,基於靈雲遠場語音識別的遠距離、高識別率支撐,現在用戶在以家庭為單位的活動範圍內,幾乎可以通過語音輕鬆操控家裡的一切智能硬體設備,推而廣之,搭載遠場識別的智能硬體產品將無限擴大適用範圍和應用場景。而靈雲內容平臺的及時出現,為智能終端增添了天氣諮詢、日曆查詢、列車查詢、航班查詢、餐館位置查詢、電話撥打、電話號碼尋找、簡訊收發、音樂及視頻播放控制、導航、車載指令等30餘種內容的支持,從根本上改變了智能終端語音交互僅能「發號施令」的弊端。
2014年,為方便國內智能車載、智能家居等智能終端廠商與集成商、開發商更好地使用靈雲平臺(hcicloud.com)全方位人工智慧能力,捷通華聲特別推出了企業級開發者專用的智能終端交互方案:靈雲種子。靈雲種子強化了靈雲全方位人工智慧平臺各項人工智慧技術的融合,包括靈雲語音識別、語音合成、語義理解、聲紋識別、人臉識別、指紋識別等全方位人工智慧交互能力,並提供簡單易用的開發接口,供智能家居、車載等各類智能終端進行集成調用,實現人與終端設備多種方式的自由溝通和控制。企業級開發商通過應用靈雲種子,可以輕鬆實現智能語音交互、智能語音導航、智能語音控制、聲紋解鎖、手寫輸入、智能圖像識別、安全身份認證等多種人機互動功能,滿足智能家居、智能車載、智能家電、機器人及可穿戴式設備等各個行業對人工智慧技術應用大量且多方位的需求。
據悉,靈雲語音喚醒技術即將應用在靈雲種子中,靈雲平臺還將陸續推出語音降噪,回聲消除、聲源定向等多種能力,為各行各業智能終端不斷提供新的技術,推動中國智能終端產業將進入一個全新的、真智能的時代!
靈雲平臺服務智能終端 合作共贏
靈雲平臺是捷通華聲於2011年推出的首個全方位人工智慧開放平臺。為推動人工智慧產業的廣泛應用,靈雲平臺自推出以來一直面向產業全面開放,包括個人開發者在內的合作夥伴,都可以通過靈雲平臺獲取智能語音、智能圖像、智能語義、生物特徵等技術能力。
捷通華聲為更好服務智能終端各領域合作夥伴,在全國各地建立分公司與辦事處,尤其在中國華南的廣州、深圳地區經濟發達、創新力強,在智能車載、智能家居、機器人、穿戴式設備研發與創新上擁有獨特優勢。為了向華南地區廣大合作夥伴提供更加直接的支持與幫助,捷通華聲2015年在深圳、廈門等地成立了分公司,旨在依託靈雲平臺,利用靈雲平臺智能語音、智能圖像、語義理解等全方位人工智慧技術能力和豐富完善的智能終端交互解決方案,與華南地區智能車載、智能家居等智能終端廠商加強合作關係,發揮華南地區智能終端設備研發和生產的優勢,期望通過與各領域合作夥伴的精誠合作,互惠共贏,共同推動中國智能終端產業的發展進步!
未來發展,捷通華聲將繼續以清華大學人工智慧研究力量為依託,更加專注智能語音等人工智慧技術研究與產業化的推廣與應用,與合作夥伴精誠合作,共同創建良好的人工智慧產業生態,共同推動中國人工智慧產業的發展進步,為中國人工智慧產業的發展做出應有的貢獻!