新四季網

首屆雲知聲 AI 技術開放日:全棧 AI 硬核技術首度曝光

2025-05-16 02:49:14

        3 月 27 日,2019 雲知聲 AI 技術開放日(Open Day)首站在北京成功舉辦。由雲知聲董事長/CTO 梁家恩博士領銜,十餘位一線 AI 行業專家先後登臺,做了覆蓋技術、學術與產業的精彩分享,活動吸引逾五百名 AI 行業精英到場。

        據了解,2019 首屆雲知聲 Open Day 將在北京、深圳、上海、廈門四站相繼舉行,其中北京作為首站,而深圳站將於 4 月中旬正式開啟。作為雲知聲一年一度的對外進行技術分享與交流的活動,Open Day 是雲知聲面向人工智慧硬核科技,更是與合作夥伴、相關學術和產業研究機構等共話人工智慧前沿技術與產業應用並探討合作的平臺。

        作為Open Day 的首站,北京站活動以「AI 技術與應用」為核心,在「雲知聲全棧 AI 技術發展」主論壇之外,還設置「知識圖譜」與「AI 晶片」兩大平行分論壇。圍繞人工智慧技術發展與產業實踐,為產業人士帶來前沿技術、優秀產品及行業應用全方面的解讀。

AI 理性回歸,全棧能力建設成決勝關鍵

        在上午的主論壇活動上,由中國科學院自動化研究所副所長/模式識別國家重點實驗室主任劉成林做了精彩的開場致辭中指出,他強調:在當下 AI 技術驅動的產業變革浪潮中,要服務好消費與產業升級的需求,技術與應用的挑戰十分艱巨。對於 AI 企業而言,需建設更加全面的技術體系,才能不斷適應並滿足場景化的實際問題,保持自身的行業優勢。

        作為活動的首位分享嘉賓,雲知聲董事長/CTO梁家恩博士在題為「理性時代的 AI 技術與產業展望」的主題演講中,分享了自身對於行業的理解與思考,並提綱挈領地解構了雲知聲覆蓋感知、認知與表達的全棧 AI 技術圖譜,貫穿技術、產品與產業閉環的全棧 AI 產業能力,以及從底層算法到 AI 晶片的硬核實力。

        梁家恩博士指出,雲知聲很早就搭建了被譽為雲知聲版「TensorFlow + GKE (Google Kubernetes Engine) 」的 Atlas 機器學習計算平臺。基於該平臺,向上支撐起信號(AEC/SSP/ISP)、語音(ASR/TTS/VPR/CALL)、語言與認知(NLU/NMT/SDS/ICI)、圖像(FID/OD/OCR)等多技術領域的橫向擴展和縱向迭代。

        通過將能力封裝在自研 AI 晶片之上,雲知聲打磨了「雲端芯」一體化產品體系,落地「AI+生活(家居、車載、機器人等)」與「AI+服務(醫療、教育、政務、酒店等)」兩大核心場景,繼而貫通雲知聲從 AI 技術到產業應用的生態閉環。

         梁家恩博士同時還指出:「在全棧能力與硬核科技雙輪驅動下,雲知聲定位需求與問題,致力於打通技術創新到產業應用的閉環,解決產業規模化應用的關鍵問題。」 

        本次活動上,李霄寒博士從 AI 晶片設計的挑戰、設計維度以及核心技術等方向,分享了雲知聲對於 AI 晶片行業和技術的看法。他認為,針對人工智慧的晶片設計,面臨著碎片化場景、馮·諾依曼內存牆、邊緣側應用的低功耗需求、安全需求四大挑戰。在晶片設計上,需面向具體場景,基於端雲互動的思想提供多模態處理的能力,在性能、功耗、面積上達到優異平衡,併兼顧連接和安全的需求。

        他介紹到,解決馮·諾依曼內存牆這一行業共同難題,關鍵在於拉近計算單位和存儲單位的距離,讓它們儘可能接近。為此,雲知聲提出了異構計算系統架構設計、加速器近算存儲結構,以及通用API函數到專用指令集的多重應對方案。與此同時,通過技術攻堅,雲知聲推出的低功耗語音喚醒技術,以及面向機器視覺專用的低功耗microISP,可很好地適應邊緣側應用的低功耗需求。而定製的安全 IP 規劃,則可滿足安全性方面的要求。

        隨後,圍繞人機互動對話系統,雲知聲 AI Labs 資深專家劉昇平介紹了雲知聲在這一領域的典型技術與進展,包括流式交互、語用計算與知性會話。他指出,雲知聲從 2013 年開始發力語音交互系統,為實現真正的智能,在 2016 年雲知聲正式提出流式對話方案,並在行業率先實現多次對話中的免喚醒;同時,雲知聲提出的語用計算技術,可以從語用而非直接從語境的角度去理解說話人意圖。結合更豐富的語義,可更好地理解語音輸入的真正含義;此外,雲知聲還把知識引入到對話過程中,讓知識圖譜全程參與整個對話過程,包括聊天、問答,都由知識圖譜來支撐,賦予機器聰明頭腦。

        從遠場語音識別的前端信號處理技術出發,雲知聲 AI Labs 資深專家關海欣分享了雲知聲針對這一領域的創新解決思路。他表示,解決遠場語音識別的關鍵點在於遠場拾音,需從前端的信號處理階段入手,妥善處理好回聲、混響、噪聲等三個核心問題。在回聲消除、混響抑制、噪聲處理等方向,雲知聲已有領先的成熟技術方案,相關技術指標均達行業優異水準。

AI 晶片百花齊放,雲端、邊緣側殊途同歸

        AI 晶片分論壇中,雲知聲副總裁李霄寒、寒武紀副總裁劉道福、NextVPU(肇觀電子)聯合創始人陳濤、比特大陸算豐 AI 產品線總裁阮沈勇四位嘉賓結合各自公司的業務方向,就 AI 晶片的關鍵技術、設計難點與場景應用進行了分享。 

            李霄寒認為,IoT 結合 AI 化浪潮,需要全新的 AIoT 晶片,多模態 AI 晶片是關鍵一步。AI 與 IoT 的疊加要求傳統解決方案朝五大方向轉型:從通用架構-AI架構、從依賴硬體到軟硬體一體、從 PPA 模式到垂直場景模式、交互從單模態轉向多模態、設備從獨立到協同。為此,雲知聲提出 Skills On Chip 概念,打造了 DeepNet2.0 多模態神經網絡處理器 IP,可兼容多種神經網絡。

        寒武紀公司副總裁劉道福結合自身產業經歷,多角度分析了智能晶片該如何做到好用和通用。他認為,設計靈活的指令集,設計可擴展性強/高效的架構,提供靈活的運算器方案,支持主流編程架構,在大規模商用中得到反饋和修正等均是做好智能晶片的重要手段。

        NextVPU 聯合創始人陳濤重點介紹了其 AI視覺處理器晶片N171。他介紹,N171是一款高度集成的SoC晶片,可作為主晶片獨立運行作業系統,還可為計算機視覺定製特殊的視覺成像引擎,可廣泛用於機器人、無人機、無人車等方面。

        去年年初,比特大陸發布雲端 AI 晶片品牌「算豐」,並按照 9 個月的速度進行產品發布和迭代。在下午的分論壇上,比特大陸算豐 AI產品線總裁阮沈勇介紹了比特大陸量產深度學習加速卡 SC3。他透露,今年上半年比特大陸還將推出第三代晶片 BM1684,BM1684 的晶片會在處理路數以及接口上有大幅度提升。

知識圖譜,打造行業專家人設

        在下午的分論壇中,雲知聲 AI Labs 資深專家劉昇平、中科院自動化所副研究員劉康、中科院軟體研究所研究員韓先培、文因互聯創始人/CEO 鮑捷、達觀數據創始人/CEO 陳運文,圍繞該領域所面臨的技術挑戰以及應用前景展開了討論。

        劉昇平指出,知識圖譜是人工智慧時代打造面向酒店服務、家居生活、兒童教育等不同場景行業專家的基石。結合在醫療領域的產業實踐,劉昇平分享了知識圖譜的構建方法與構建流程。他認為,在構建知識圖譜時,一定要看行業歷史上的知識表現方法,通過借鑑這些方法來降低成本;另外一定要應用驅動,而且一定要選好知識圖譜的評測方法。

        中科院自動化所副研究員劉康、中科院軟體研究所研究員韓先培兩位嘉賓則分別結合自身的研究方向,分享了自然語言理解、知識獲取與對話生成等技術領域的最新進展。

        隨後,文因互聯創始人/CEO 鮑捷分享了關於知識圖譜的一些核心概念知識、基本原則與演進方向。他認為,知識圖譜的非常好的用途在於「不可預期」的應用,其突破點可能在於人機互動(HCI),而不在於知識的提取或知識表現。

        知識圖譜論壇的最後一位嘉賓,由達觀數據創始人/CEO 陳運文帶來文本智能處理領域技術發展和應用成果的分享。他指出,隨著各行業向智能化轉型的發展需要,文檔內容自動化處理在大型集團企業、政府、教育、金融等行業有著廣闊應用前景。藉助自然語言理解、機器翻譯、知識圖譜等技術,在深度學習的加持下,可以讓機器高效、自動化地實現文檔的閱讀、審閱和撰寫,實現數據化、智能化運營,將有效提升企業運營效率。

同类文章
佩戴無壓力,音質更出眾 米家智能音頻眼鏡體驗

佩戴無壓力,音質更出眾 米家智能音頻眼鏡體驗

  據數據顯示,目前我國近視人群超過6億人,環顧我們的周圍,很多人都戴著眼鏡,這也為智能眼鏡的發展提供了機會,智能眼鏡的優勢在於可以無縫替換掉普通的眼鏡,而且支持音頻功能,能夠取代藍牙耳機,使用起來還是非常方便的,智能眼鏡逐漸成為近視用戶的選擇。  不過,相較於傳統的眼鏡,智能眼鏡因為賦予了智能化的
從燙手到凍手?夏天玩手機最痛苦的事終於被它解決了……

從燙手到凍手?夏天玩手機最痛苦的事終於被它解決了……

  最近的手機圈很有意思,除了高端旗艦大秀操作外,中端機們也紛紛開卷。前有一加把天璣9000幹到2千價位,後有紅米首 發驍龍7+Gen2,各個都是性能小鋼炮。  但性能的增強也會帶來新的問題,隨著天氣轉暖,手機也越來越容易發熱,甚至燙手,對這些主打遊戲體驗的手機來說簡直是致命打擊。更別提iPhone
純電SUV新力作,小鵬G6 新一波官方圖公布

純電SUV新力作,小鵬G6 新一波官方圖公布

  小鵬汽車官方微博於今日公布了一組小鵬G6的圖片。不少網友都認為這款新車的造型很不錯。預計在本月的上海車展上,小鵬G6將正式亮相,敬請期待。  來自百度百科目前的介紹。小鵬G6是一款純電動多用途乘用車。其寬高分別為4753/1920/1650毫米,軸距為2890毫米,搭配235/60 R18和25
羅永浩宣布:進軍電腦直播,初期只帶貨這四樣

羅永浩宣布:進軍電腦直播,初期只帶貨這四樣

  3月19日羅永浩通過個人微博對外宣布:看了招商證券那份著名的調研報告之後,我決定做電商直播了。雖然我不適合賣口紅,但相信能在很多商品的品類裡做到帶貨一哥。歡迎各種優質商品的廠商跟我們的商務團隊聯繫,順便也提醒大家提前存好錢等著嚇一跳。  羅永浩表示,初期團隊選品側重於以下幾點,1、具有創新特性的
拼多多「百億補貼」將新增500名客服,發布致歉信,並致謝消費者

拼多多「百億補貼」將新增500名客服,發布致歉信,並致謝消費者

  近日,拼多多公布了2019年Q4財報,數據顯示,拼多多全年GMV高達10066億元,較上年同期增長113%,全年營收高達301.4億元,較上年增長130%,拼多多APP月活也已經達到4.815億,單季度淨增5190萬。  拼多多「百億補貼」活動吸引了很多消費者,不過近日名為「melon Hone
雷柏新女性系列ralemo品牌視頻上線!樂萌,感官秘境

雷柏新女性系列ralemo品牌視頻上線!樂萌,感官秘境

  雷柏新女性系列ralemo品牌視頻上線!  一份心動預警,請查收!  她共有三個章節,  【ra無線】  【le樂】  【mo萌】  從不同視角切入,  以水為媒介,  串聯起ralemo與新女性的生活方式和儀式感。  雷柏一直試圖在尋找自由藝術風格與美好生活間那個最舒服的平衡點,  融匯雷柏的
告別原裝充電器 雷柏PA65氮化鎵充電器詳解

告別原裝充電器 雷柏PA65氮化鎵充電器詳解

  近日,領軍國產外設品牌,實力大廠上市企業Rapoo雷柏,推出了PA65氮化鎵快充充電器,採用第三代半導體材料氮化鎵黑科技,擁有65W大功率輸出,支持市面主流快充協議,USB-A+USB-C雙接口,6重安全防護,90°可摺疊插頭等,全面使用如今的筆記本、手機、移動電源等產品,讓你時刻能量滿滿。  
暢享高清 雷柏C260電腦高清攝像頭上市

暢享高清 雷柏C260電腦高清攝像頭上市

  目前可謂是一個直播的熱潮,各大平臺湧進大量的直播,遊戲直播,帶貨直播,美食直播等等,一個帶麥克風自動對焦高清的攝像頭對於主播來說是必不可少的利器,能讓主播與觀眾盡情的愉快互動。  近日,領軍國產外設品牌,實力大廠上市企業Rapoo雷柏,推出了C260電腦高清攝像頭,1080P的自動對焦高清影像,
高清視訊 雷柏C260電腦高清攝像頭詳解

高清視訊 雷柏C260電腦高清攝像頭詳解

  Rapoo雷柏,領軍國產外設品牌,實力大廠上市企業增添了先進電腦高清攝像頭——C260電腦高清攝像頭,1080P的自動對焦高清影像,95°的超廣角鏡頭,雙重的降噪麥克風,360°水平旋轉的鏡頭等,這樣一款299元的攝像頭到底有什麼它的獨到之處呢?下面緊隨筆者的腳步來對它做進一步的了解。  C26
小身材大能量 雷柏PA65氮化鎵充電器圖賞

小身材大能量 雷柏PA65氮化鎵充電器圖賞

  近日,領軍國產外設品牌,實力大廠上市企業Rapoo雷柏,推出了PA65氮化鎵快充充電器,採用第三代半導體材料氮化鎵黑科技,擁有65W大功率輸出,支持市面主流快充協議,USB-A+USB-C雙接口,6重安全防護,90°可摺疊插頭等,全面使用如今的筆記本、手機、移動電源等產品,讓你時刻能量滿滿。