首屆雲知聲 AI 技術開放日:全棧 AI 硬核技術首度曝光
2025-05-16 02:49:14
3 月 27 日,2019 雲知聲 AI 技術開放日(Open Day)首站在北京成功舉辦。由雲知聲董事長/CTO 梁家恩博士領銜,十餘位一線 AI 行業專家先後登臺,做了覆蓋技術、學術與產業的精彩分享,活動吸引逾五百名 AI 行業精英到場。
據了解,2019 首屆雲知聲 Open Day 將在北京、深圳、上海、廈門四站相繼舉行,其中北京作為首站,而深圳站將於 4 月中旬正式開啟。作為雲知聲一年一度的對外進行技術分享與交流的活動,Open Day 是雲知聲面向人工智慧硬核科技,更是與合作夥伴、相關學術和產業研究機構等共話人工智慧前沿技術與產業應用並探討合作的平臺。
作為Open Day 的首站,北京站活動以「AI 技術與應用」為核心,在「雲知聲全棧 AI 技術發展」主論壇之外,還設置「知識圖譜」與「AI 晶片」兩大平行分論壇。圍繞人工智慧技術發展與產業實踐,為產業人士帶來前沿技術、優秀產品及行業應用全方面的解讀。
AI 理性回歸,全棧能力建設成決勝關鍵
在上午的主論壇活動上,由中國科學院自動化研究所副所長/模式識別國家重點實驗室主任劉成林做了精彩的開場致辭中指出,他強調:在當下 AI 技術驅動的產業變革浪潮中,要服務好消費與產業升級的需求,技術與應用的挑戰十分艱巨。對於 AI 企業而言,需建設更加全面的技術體系,才能不斷適應並滿足場景化的實際問題,保持自身的行業優勢。
作為活動的首位分享嘉賓,雲知聲董事長/CTO梁家恩博士在題為「理性時代的 AI 技術與產業展望」的主題演講中,分享了自身對於行業的理解與思考,並提綱挈領地解構了雲知聲覆蓋感知、認知與表達的全棧 AI 技術圖譜,貫穿技術、產品與產業閉環的全棧 AI 產業能力,以及從底層算法到 AI 晶片的硬核實力。
梁家恩博士指出,雲知聲很早就搭建了被譽為雲知聲版「TensorFlow + GKE (Google Kubernetes Engine) 」的 Atlas 機器學習計算平臺。基於該平臺,向上支撐起信號(AEC/SSP/ISP)、語音(ASR/TTS/VPR/CALL)、語言與認知(NLU/NMT/SDS/ICI)、圖像(FID/OD/OCR)等多技術領域的橫向擴展和縱向迭代。
通過將能力封裝在自研 AI 晶片之上,雲知聲打磨了「雲端芯」一體化產品體系,落地「AI+生活(家居、車載、機器人等)」與「AI+服務(醫療、教育、政務、酒店等)」兩大核心場景,繼而貫通雲知聲從 AI 技術到產業應用的生態閉環。
梁家恩博士同時還指出:「在全棧能力與硬核科技雙輪驅動下,雲知聲定位需求與問題,致力於打通技術創新到產業應用的閉環,解決產業規模化應用的關鍵問題。」
本次活動上,李霄寒博士從 AI 晶片設計的挑戰、設計維度以及核心技術等方向,分享了雲知聲對於 AI 晶片行業和技術的看法。他認為,針對人工智慧的晶片設計,面臨著碎片化場景、馮·諾依曼內存牆、邊緣側應用的低功耗需求、安全需求四大挑戰。在晶片設計上,需面向具體場景,基於端雲互動的思想提供多模態處理的能力,在性能、功耗、面積上達到優異平衡,併兼顧連接和安全的需求。
他介紹到,解決馮·諾依曼內存牆這一行業共同難題,關鍵在於拉近計算單位和存儲單位的距離,讓它們儘可能接近。為此,雲知聲提出了異構計算系統架構設計、加速器近算存儲結構,以及通用API函數到專用指令集的多重應對方案。與此同時,通過技術攻堅,雲知聲推出的低功耗語音喚醒技術,以及面向機器視覺專用的低功耗microISP,可很好地適應邊緣側應用的低功耗需求。而定製的安全 IP 規劃,則可滿足安全性方面的要求。
隨後,圍繞人機互動對話系統,雲知聲 AI Labs 資深專家劉昇平介紹了雲知聲在這一領域的典型技術與進展,包括流式交互、語用計算與知性會話。他指出,雲知聲從 2013 年開始發力語音交互系統,為實現真正的智能,在 2016 年雲知聲正式提出流式對話方案,並在行業率先實現多次對話中的免喚醒;同時,雲知聲提出的語用計算技術,可以從語用而非直接從語境的角度去理解說話人意圖。結合更豐富的語義,可更好地理解語音輸入的真正含義;此外,雲知聲還把知識引入到對話過程中,讓知識圖譜全程參與整個對話過程,包括聊天、問答,都由知識圖譜來支撐,賦予機器聰明頭腦。
從遠場語音識別的前端信號處理技術出發,雲知聲 AI Labs 資深專家關海欣分享了雲知聲針對這一領域的創新解決思路。他表示,解決遠場語音識別的關鍵點在於遠場拾音,需從前端的信號處理階段入手,妥善處理好回聲、混響、噪聲等三個核心問題。在回聲消除、混響抑制、噪聲處理等方向,雲知聲已有領先的成熟技術方案,相關技術指標均達行業優異水準。
AI 晶片百花齊放,雲端、邊緣側殊途同歸
AI 晶片分論壇中,雲知聲副總裁李霄寒、寒武紀副總裁劉道福、NextVPU(肇觀電子)聯合創始人陳濤、比特大陸算豐 AI 產品線總裁阮沈勇四位嘉賓結合各自公司的業務方向,就 AI 晶片的關鍵技術、設計難點與場景應用進行了分享。
李霄寒認為,IoT 結合 AI 化浪潮,需要全新的 AIoT 晶片,多模態 AI 晶片是關鍵一步。AI 與 IoT 的疊加要求傳統解決方案朝五大方向轉型:從通用架構-AI架構、從依賴硬體到軟硬體一體、從 PPA 模式到垂直場景模式、交互從單模態轉向多模態、設備從獨立到協同。為此,雲知聲提出 Skills On Chip 概念,打造了 DeepNet2.0 多模態神經網絡處理器 IP,可兼容多種神經網絡。
寒武紀公司副總裁劉道福結合自身產業經歷,多角度分析了智能晶片該如何做到好用和通用。他認為,設計靈活的指令集,設計可擴展性強/高效的架構,提供靈活的運算器方案,支持主流編程架構,在大規模商用中得到反饋和修正等均是做好智能晶片的重要手段。
NextVPU 聯合創始人陳濤重點介紹了其 AI視覺處理器晶片N171。他介紹,N171是一款高度集成的SoC晶片,可作為主晶片獨立運行作業系統,還可為計算機視覺定製特殊的視覺成像引擎,可廣泛用於機器人、無人機、無人車等方面。
去年年初,比特大陸發布雲端 AI 晶片品牌「算豐」,並按照 9 個月的速度進行產品發布和迭代。在下午的分論壇上,比特大陸算豐 AI產品線總裁阮沈勇介紹了比特大陸量產深度學習加速卡 SC3。他透露,今年上半年比特大陸還將推出第三代晶片 BM1684,BM1684 的晶片會在處理路數以及接口上有大幅度提升。
知識圖譜,打造行業專家人設
在下午的分論壇中,雲知聲 AI Labs 資深專家劉昇平、中科院自動化所副研究員劉康、中科院軟體研究所研究員韓先培、文因互聯創始人/CEO 鮑捷、達觀數據創始人/CEO 陳運文,圍繞該領域所面臨的技術挑戰以及應用前景展開了討論。
劉昇平指出,知識圖譜是人工智慧時代打造面向酒店服務、家居生活、兒童教育等不同場景行業專家的基石。結合在醫療領域的產業實踐,劉昇平分享了知識圖譜的構建方法與構建流程。他認為,在構建知識圖譜時,一定要看行業歷史上的知識表現方法,通過借鑑這些方法來降低成本;另外一定要應用驅動,而且一定要選好知識圖譜的評測方法。
中科院自動化所副研究員劉康、中科院軟體研究所研究員韓先培兩位嘉賓則分別結合自身的研究方向,分享了自然語言理解、知識獲取與對話生成等技術領域的最新進展。
隨後,文因互聯創始人/CEO 鮑捷分享了關於知識圖譜的一些核心概念知識、基本原則與演進方向。他認為,知識圖譜的非常好的用途在於「不可預期」的應用,其突破點可能在於人機互動(HCI),而不在於知識的提取或知識表現。
知識圖譜論壇的最後一位嘉賓,由達觀數據創始人/CEO 陳運文帶來文本智能處理領域技術發展和應用成果的分享。他指出,隨著各行業向智能化轉型的發展需要,文檔內容自動化處理在大型集團企業、政府、教育、金融等行業有著廣闊應用前景。藉助自然語言理解、機器翻譯、知識圖譜等技術,在深度學習的加持下,可以讓機器高效、自動化地實現文檔的閱讀、審閱和撰寫,實現數據化、智能化運營,將有效提升企業運營效率。