新四季網

捷通華聲靈雲遠場語音識別震撼發布

2023-07-11 06:01:02 3

  靈雲科技26日消息:捷通華聲靈雲遠場語音識別技術全面升級,可獲取7到8米外的語音,語音識別率仍不低於90%,從根本上改變目前市場上因各式問題導致的僅能近距離交互的方式,為智能語音技術應用於智能車載、智能家電、智能家居、機器人等靈雲奠定堅實的基礎,讓智能硬體不再為遠場語音識別的瓶頸而擔憂。據悉,靈雲種子已採用靈雲遠場語音識別技術。

  靈雲種子自2014年發布以來,得到了智能硬體、車載、機器人等多個領域的一致好評,特別是在機器人領域,解決了之前存在的種種人機互動困難的問題,使設備脫離了手動控制,真正讓機器人實現了「能說會聽、能思考、會判斷」。

  靈雲遠場語音識別 距離不再阻礙交流

  很長一段時間以來,科大訊飛、NUANCE等語音技術公司都在努力開拓智能硬體市場,但智能硬體產品在很多場景下因語音交互體驗不如人意而不能滿足市場的需求,究其原因主要是受限於背景噪音、其他聲音幹擾、回聲、混響等多重複雜因素,進而導致的識別距離近、識別率低等明顯痛點,在這些問題沒有解決之前,智能硬體語音交互方面將一直是一個短板。鑑於此,靈雲推出遠場語音識別技術,將極大推進語音識別技術在真實生活場景中的應用。

  遠場語音識別技術的核心有兩點,一是語音前端處理:利用麥克風陣列、回聲消除等技術將目標說話人的聲音增強,並抑制/消除周圍無用的聲音(噪聲+回聲);二是語音識別引擎針對麥克風陣列處理後的數據進行專門優化,以使遠場識別效果達到最優。

  靈雲遠場語音識別技術,是基於多麥克風陣列的語音硬體前端方案,並利用麥克風陣列的空域濾波特性——在目標說話人方向形成拾音波束,抑制波束之外的噪聲和反射聲,其降噪和去混響效果均為國內領先水平,並可成功實現語音喚醒;聲源定位;遠場識別;回聲消除;語音打斷等5大功能。

  可以想像,基於靈雲遠場語音識別的遠距離、高識別率支撐,現在用戶在以家庭為單位的活動範圍內,幾乎可以通過語音輕鬆操控家裡的一切智能硬體設備,推而廣之,搭載遠場識別的智能硬體產品將無限擴大適用範圍和應用場景。目前的方案主要根據算法不同,可分為適用於電視機、空調、機器人等的加性麥克風陣列和適用於採訪話筒、錄音筆等的差分麥克風陣列。

  靈雲種子 智能終端交互一站式解決方案

  智能硬體熱炒兩三年,至今未見哪個企業已經將成熟的一套方案或者說場景完整地展現出來並得到推廣。總體上來說,目前很多企業設想的場景對於消費者的價值究竟是什麼沒有考慮清楚;外部來說,智能家居還未深入老百姓,市場還未感知到,沒有爆款產品,產品形態整體傳統;從內部講,大大小小的企業都在喊著做平臺,資本市場也炒的很熱,但實際上參與其中的很多智能軟體公司並沒有一套整體的方案能拿的出手。

  如果整體目前玩不轉,那麼先從做單品或者微場景來吸引大眾眼球似乎是不錯的路子,這就是智能硬體目前呈現的結果。在智能家居的部分,基本上所有推出產品的企業都在強調可以聯WIFI,可以遠程操控,甚至可以在一臺冰箱上看視頻聽音樂,即所謂的娛樂化。可這些並不是真正的「智能」。目前,智能單品遇到的市場瓶頸,包括操控形式本末倒置、形式大於實際效果、存在安全性等問題。

  怎麼定義智能,並真正實現智能,依然為產業界,也是媒體爭論的熱點。越來越多的人認為,能夠實現手機App控制即為智能,但是手機控制卻也需要手動操作各類硬體,依然不夠智能。

  隨著人工智慧技術的應用越來越廣泛,手機app控制、語音控制等多重控制方式越來越多的應用到了智能硬體上。靈雲智能種子可實現通過語音識別、語音合成、自然語言理解等人工智慧技術,為用戶提供各種智能交互服務,用戶只需要用說話的方式發布命令,就可以控制相應的系統。

  例如,對著手機app說一聲「我五分鐘之後到家」,就會得到回覆「好的,按照您的習慣,空調已經調到26度,熱水器調到35度」;說一聲「幫我煮杯咖啡」,咖啡機就開始工作;說一聲「太熱了,溫度調低兩度」,空調就開始調溫窩在沙發上看著無聊的電視節目,說一聲「我想看上周的非誠勿擾」,對應的電視臺就自動搜索出來了;說一聲「我要睡覺了」,空調就自動調到睡眠模式,門窗自動鎖閉。用戶可以通過語音來開啟燈光、調整燈光的亮度、啟動私人家庭影院、控制家用電器、等等,讓家庭自動化的功能往前邁向了一大步。

  但由於國內諸多語音廠商能力參差不齊、語義理解能力高低有別,而且語音交互僅能辨別指令及交互,僅是智能家居的一部分,並不能為家居的安防、家庭成員的辨別提供能力,因此並不能為家居提供全方位的智能服務。而國內技術廠商所推出的智能家居解決方案卻往往固步在「聲」的方向,無法覆蓋聲紋識別、人臉識別、指紋識別等生物識別能力等全套能力。

  2014年,為方便智能終端廠商與集成商、開發商更好地使用靈雲平臺(hcicloud.com)全方位人工智慧能力,捷通華聲特別推出了企業級開發者專用的智能終端交互方案:靈雲種子。靈雲種子強化了靈雲全方位人工智慧平臺各項人工智慧技術的融合,包括靈雲語音識別、語音合成、語義理解、聲紋識別、人臉識別、指紋識別等全方位人工智慧交互能力,並提供簡單易用的開發接口,供智能家居、車載等各類智能終端進行集成調用,實現人與終端設備多種方式的自由溝通和控制。企業級開發商通過應用靈雲種子,可以輕鬆實現智能語音交互、智能語音導航、智能語音控制、聲紋解鎖、手寫輸入、智能圖像識別、安全身份認證等多種人機互動功能,滿足智能家居、智能車載、智能家電、機器人及可穿戴式設備等各個行業對人工智慧技術應用大量且多方位的需求。

  經過與眾多智能終端廠商的合作,為不斷滿足合作的應用需求,捷通華聲「靈雲種子」已經升級到2.0版,新版靈雲種子新增雲端和本地同時識別,並從結果中擇優的功能,提高了語音識別的準確率和識別速度,優化了意圖理解的幾十個領域。目前,靈雲種子可廣泛應用在以下場景中:

  l 語音檢索:支持包括路況導航類、家居菜單智能導航類、周邊服務類、生活服務類、娛樂類等多種語音檢索服務;

  l 消息提醒:人性化定製推送類別:來電提醒、簡訊提醒、應用提醒,並可將設置在雲端;

  l 通訊娛樂:支持簡訊發送,電話通訊,多媒體播放,手機操控;

  l 健康服務:支持傳感器,提供傳感器數據分析,為用戶提供健康圖表,並結合雲端服務提供定製健康指導等現有及正在研發的能力;

  l 雲平臺:基於靈雲平臺,提供多設備數據同步,私人信息雲存儲,智能推薦;

  這些方案類似於一個開發模版,靈雲(hcicloud.com)平臺將這些特定領域和場景的智能交互方案經過設計和優化後,打造出一體化的全智能人機互動解決方案——「靈雲種子」。直接應用「靈雲種子」配置的技術服務和內容服務,即可滿足各種智能硬體的智能化需求。

  在機器人方面,靈雲機器人已成功應用靈雲種子,全面整合捷通華聲靈雲平臺多項人工智慧技術能力,讓稍顯「笨拙」的物理機器人成為真正「能說會聽,能寫會看,能思考、會判斷」,有一定分析與辨別能力的聰明、生動的智慧機器人,可廣泛為金融、電信、交通、教育、醫療等智能客戶服務領域,也可以為教育、娛樂、家居生活等行業提供智能問答、智能聊天、智能「保姆」等服務。同時,靈雲機器人具備平滑的移植性,可移植到市面上各類智慧機器人硬體設備中。

  據捷通華聲靈雲產品研發部門人員介紹,靈雲種子更主要的作用是在產業中起到示範與引導作用,期望伴隨靈雲種子在各行各業智能硬體中的不斷「生根發芽」,中國智能硬體將進入一個全新的、真智能的時代!

  捷通華聲靈雲種子紮根智能終端 攜手合作夥伴共贏

  靈雲平臺(hcicloud.com)是捷通華聲於2011年推出的首個全方位人工智慧開放平臺。為推動人工智慧產業的廣泛應用,靈雲平臺自推出以來一直面向產業全面開放,包括個人開發者在內的合作夥伴,都可以通過靈雲平臺獲取智能語音、智能圖像、智能語義、生物特徵等技術能力。

  在中國華南地區,尤其廣州、深圳地區經濟發達、創新力強,在智能家居、智能車載、智能家電、機器人、穿戴式設備研發與創新上擁有獨特優勢。為了向華南地區廣大合作夥伴提供更加直接的支持與幫助,捷通華聲在2015年初成立了深圳捷通華聲公司,旨在依託靈雲平臺,利用靈雲平臺智能語音、智能圖像、語義理解等全方位人工智慧技術能力和豐富完善的智能終端交互解決方案,與華南地區硬體廠商加強合作關係,發揮華南地區智能終端設備研發和生產的優勢,期望伴隨靈雲種子在各行各業智能硬體中的不斷「生根發芽」,以推動智能終端產業長足的進步,攜手智能硬體廠商互惠共贏,推動中國智能硬體進入一個全新的、真智能的時代!

  未來發展,伴隨人工智慧產業在世界範圍內的高速發展,捷通華聲與清華大學共同創建清華靈雲人工智慧研究中心、清華海峽研究院人工智慧研究中心,捷通華聲將以清華大學人工智慧研究力量為依託,更加專注人工智慧技術研究與產業化的推廣與應用,與合作夥伴精誠合作,共同創建良好的人工智慧產業生態,共同推動中國人工智慧產業的發展進步,為中國人工智慧產業的發展做出應有的貢獻!

同类文章

創新才能共贏酷6網UGC模式為你引航

    YouTube是世界上最大的視頻分享網站,以UGC(用戶產生內容)視頻互動分享為主,而對於這種UGC視頻平臺建設而言,用戶與內容量是發揮規模效應的基礎。作為短視頻網站的代表,酷6網一直堅持著UGC路線,他所擁有的海量視頻資源以及優秀拍客群體,都為它在短視頻領域的成功奠定了基礎,使它成為目前中

「短酷」APP成為拜年「潮品」

        春節期間,一款名為「短酷」的APP悄然躥紅。一年一度的新春佳節是中國老百姓歡聚一堂、享受人生的日子,大家在一起留影紀念必不可少。「短酷」能夠將照片一鍵變成短視頻,還可以配樂、配上自己想說的話,順應了過年期間記錄美好回憶的需求。也有些不能回家團圓的朋友用「短酷」為家人做一封「電子家書

聯建光電攜手微信紅包 史上最大紅包有望出爐

    【2014年2月13日,深圳】在2014年元宵節和情人節「雙節」臨近之際,中國企業家思想群友(微信公眾號,CEOideas )攜手創業板上市公司聯建光電(股票代碼,300269),開展微信搶紅包創意活動。本次活動是繼2014年農曆微信搶紅包後又一次具有實驗意義的傳播活動,將掀起微信搶紅包的又

搜狗壁紙:甜蜜浪漫過雙節

    今年的2月14日正好就是農曆正月十五,元宵節和情人節趕在了同一天。還沒從春節的喜悅中緩過神來的朋友們,又將迎來一個特別浪漫的節日。為此,搜狗壁紙為廣大用戶準備了眾多精美的元宵節及情人節壁紙,為大家增添節日氣氛。   元宵節 鬧元宵  農曆正月十五元宵節,又稱為「上元節」,是中國漢族和部分兄弟

騰訊QQ上線3D大黃臉表情包:目前已有16種

       說到QQ大黃臉表情,大家一定都非常熟悉,而根據相關的統計數據,其中「笑哭」的表情也是中國網遊使用頻率最高的表情。近日,騰訊QQ再次推出了3D版的QQ黃臉表情,共16個表情包,讓人看了忍不住像要下載。      據了解,這一套看起來超萌的表情包卻耗費了設計師不少的精力,尤其是那個經典的「
你們不是水軍!?仙劍6發行商認錯道歉

你們不是水軍!?仙劍6發行商認錯道歉

    《仙劍奇俠傳6》引發的爭議又進入了新階段了——玩家的吐槽還在繼續,周六官方火上澆油式的公關招到了更多人的反感,但居高臨下指責水軍抹黑的仙劍6發行商暢遊樂動已經頂不住了,昨晚刪除了之前的微博,已經向玩家表示歉意。    事情的起因不需多說了,玩仙劍6的肯定知道,不玩的人估計也不會關心。其實大家
繼續打巨魔的節奏 魔獸7.0新內容曝光

繼續打巨魔的節奏 魔獸7.0新內容曝光

    這是一篇美服論壇的劇透帖子——這樣的帖子每天發10個都不會累,但是這一個不同:次的LZ似乎就是上次在MMO champion上爆料WOD的那個啊!    要不就是暴雪沒學乖,要不就是暴雪故意的,不過由於WOD這種營銷看起來還挺成功,故意的可能性也許大?    資料片內容預覽      資料片
《爐石傳說》"冠軍的試煉"八月開啟

《爐石傳說》"冠軍的試煉"八月開啟

    在地精與侏儒交戰8個多月之後,《爐石傳說》的新內容「冠軍的試練」即將在8月初正式登場,屆時將有132張全新的卡牌、全新主題的對戰面板以及歡迎各位買買買的新卡包來到各位玩家面前,下面我們就一起來了解一下《爐石傳說》「冠軍的試練」中的內容吧。以下內容來自爐石傳說官網    來自艾澤拉斯各個角落的
不再掉幀?《仙劍奇俠傳6》新補丁到來

不再掉幀?《仙劍奇俠傳6》新補丁到來

《仙劍奇俠傳6》PC版的優化讓很多玩家揪心,在遊戲發售後,《仙劍奇俠傳6》官方面對玩家提出的各種問題積極回應反饋,補丁也在緊急製作中,今日,《仙劍奇俠傳6》的1.0.3補丁正式發布,一起來看看都更新了哪些玩家迫切等待修復的問題吧。    針對之前《仙劍奇俠傳6》版本的3D效能優化效果不流暢,或者運行
《虛空之遺》開啟預購 快來買買買!

《虛空之遺》開啟預購 快來買買買!

    作為暴雪旗下《星際爭霸II》三部曲的最終篇章——《星際爭霸II:虛空之遺》於今日正式開啟了預售,現在各位玩家可以通過點擊「」或打開自己的戰網客戶端進入到《星際爭霸II:虛空之遺》國服的預購頁面,提前入手《星際爭霸II:虛空之遺》。    在這次《星際爭霸II:虛空之遺》國服的預售活動中,各位