搜狗地圖ai交互(語音交互導航策略背後)
2023-05-23 09:03:19 1
李根 發自 一路向南G71
量子位報導 | 公眾號 QbitAI
AI代表的新技術可能不光開拓新領域,也在衝擊固有市場格局。
新技術 舊產品,這樣的趨勢變革正在發生。
語音交互 地圖=?2016年年底,網易北京搬離清華科技園啟迪科技大廈,隔壁的搜狗隨即租下兩層,安排搜狗地圖和搜狗語音團隊入駐。半年後,這兩支協同工作的團隊推出完全語音驅動的語音地圖產品,取名「智能副駕」。
這是一款語音驅動的手機導航地圖產品,完全基於手機,完全語音交互。之所以取名「智能副駕」,是因為搜狗希望它在車內充當起「副駕」的作用,有問有答。這算不上是全新的產品,本質還是手機地圖導航。
在這個領域,百度和高德佔據了大部分市場份額,在移動網際網路時代廝殺了整整7年,並且在產品細節和體驗上費盡心思,連導航的語音包都花樣百出,希望覆蓋到所有目標群體。
更主要的是,語音為核心交互的地圖導航,在手機之外的終端硬體上早已試水,特別是此前競爭激烈的車機和當前愈加火熱的後視鏡上,通過語音驅動拿下車載場景,有巨頭玩家,也有初創廠商,有前裝合作方,也有後裝攪局者。
你可以用語音說出想去的目的地,如果是去一個公園,還能繼續用語音確定抵達哪個門,路線確定後,還能繼續用語音進一步規劃:比方要求不走二環或者中途加油等。這的確與百度、高德地圖的基本語音交互不同。
當然這個功能算不上100%成熟。多輪交互失敗的情況並不罕見,如果要增加一個途經點,有可能會打亂之前的行程規劃。方言識別肯定是不行,即便是普通話也做不到100%。
另有數據稱車載情況下,語音識別準確率只有90%左右。
這是一個有點冒險的嘗試。
「趟過不少坑」顯然,對於市場份額更大的廠商來說,冒險的成本更大。
一是基於手機的多輪語音交互,識別準確率是個大問題,從硬體方面的麥克風陣列,到手機運算資源消耗的考量,技術挑戰不小。
二是用戶體驗要求高,一旦上線多輪語音交互,內在要求必定是又快又準,一旦識別有誤,或交互「弱智」,用戶體驗就會大打折扣,除了讓人罵娘,可能還會客觀上助攻競爭對手。
所以把多輪語音交互帶入手機地圖,多少算是「激進」之舉。但對搜狗地圖來說,包袱要小得多,轉身和嘗試可以快得多,即便技術上的坑不少。
搜狗地圖總經理孔祥來也承認,在產品立項的半年內,「在技術上趟過不少坑」。
首先是語音識別問題。車載環境,手機終端,應用環境接近遠場識別,需要面臨降噪、回聲、糾錯等語音識別方面的技術挑戰,而且導航地圖需求中,只要一個字、一個詞識別不準,都會造成意圖錯誤,用戶體驗差。
其次是語義理解。車載環境需要儘可能降低眼和手的使用,全靠人機語音對話理解意圖,而多輪交互還會對對話模型和引導模型提出高要求。
最後是數據重構,文字輸入客觀上要求極盡準確,但語音交互卻可能語焉不詳,單如「首都機場」,就可能面臨「航站樓T1、T2、T3」和「出發/到達」等數據的結構關係構建,換而言之是要讓機器模型建立起「知識體系」。
而這次新產品的發布,就是搜狗對上述技術挑戰交出的答卷。孔祥來告訴量子位,主要有三方面:
一圍繞語音識別,針對性做了4000小時車載語音訓練,並專門針對POI(興趣點,包括商家商鋪和標誌性建築物等)數據的優化提升語音識別準確率,還要建立語音、語義、地圖概率模型,在多個識別結果中做反向挑選,以此作為準確率輔助手段。
二是在最後產品中準備了10萬個對話路徑,用啟發式對話模型,不斷細分搜索結果類型,通過對話引導,讓機器理解人類的真正意圖。
最後則是POI數據的重構,按照現實世界的隸屬關係,組成父子、容器、區域從屬關係,為語音對話提供相應精準的領域知識,保障播報和上下文理解能力。
孔祥來還說,在三步語音交互方案實現後,目前的搜狗地圖,可能在AI新能力的基礎上,擁有了新的產品形態,產生新模式。
但就此會改變手機地圖競爭格局嗎?
難。
換道競爭在孔祥來看來,之所以此時上馬「智駕副手」,重點並不在重新搶奪手機地圖市場份額——意義已非常有限。
「現在市場份額搶奪、用戶增長,可能不是最主要的目的。我們現在賦能地圖,希望通過這樣的嘗試去獲得車廠的認可。其實語音交互大方向已經被認可了,但之前車廠嘗試過語音方案後,認為效果一般,所以現在我們相當於通過手機去進行驗證,再進一步獲得車廠認可,比我拿著PPT去車廠硬講,要靠譜很多。」
此外,孔祥來也認為:新的競爭已經不再圍繞舊形態展開,即不再圍繞「手機地圖」展開。
「語音交互引入地圖、車內場景後,手機地圖可能要被重新定義了,將不再是傳統的工具軟體。」這位搜狗地圖總經理說。
語音交互 地圖,會構建一種全新的形態和模式。用戶可以在導航中可以用語音說任何事情,不光是導航,可以提供更多服務:問答的能力、搜索水平。這個能力、習慣形成,那遠比在地圖裡做O2O靠譜。
「更加直白地說,相當於得到了一個車內語音交互的入口,就不再是一個地圖軟體 語音,而是在車內的語音助手,只不過擁有了導航的能力而已,用戶在車內的語音助手,提供車內的任何服務,這跟地圖導航不再是一個維度的事情。」
聽起來像是利用新一代技術,換到了更高的維度參與競爭,然後高維打低維,在新場景新模式中完成「彎道超車」。
但事情也並沒有那麼簡單,百度和高德也在利用新技術加碼布局,方向不盡一致而已。
百度的大方向是車,無論是車聯網、智能駕駛還是無人車,地圖的核心功能是不斷精確的路網數據和搜索能力,把AI、AR等一系列新技術疊加到產品中。
而多輪語音交互方面,實際百度已經在車機產品CarLife、後視鏡CoDriver中引入,何時遷移應用到手機地圖中,可能只是時間問題。
高德的方向是「數據中心」。在最新闡述的AI應用中,高德的方向是「活地圖」,利用機器模型搭建交通大腦,在實時數據計算的基礎上,把實時路況、動態預測和用戶偏好作為體驗改善的大方向。
目前,語音交互在高德地圖中,被當做了輔助性的搜索手段,技術由科大訊飛提供,這也意味著如果高德在地圖導航中上馬語音交互,多半會與訊飛進一步合作,產品的磨合或許挑戰相對更大。
當然,阿里集團CTO王堅也曾公開表示,利用阿里雲的計算力和大數據模型,阿里自主研發的語音交互也迅速取得了突破,但是否會直接賦能高德,目前難以獲悉。
不過可以確定的是,原本以為競合格局已定的領域,現在又因為AI浪潮的到來,展現出新的可能,新一輪比拼再度開啟,固有優勢帶來的機會,有可能稍縱即逝。
這可能會是很長一段時間內的趨勢。
關於市場格局最後,量子位補充一點背景資料。
根據搜狗地圖2015年5月公布的數據,在手機地圖市場,激活用戶共計1.5億,排名第三。百度地圖去年6月公布的數據為5億用戶。高德地圖去年10月公布的數據為7億用戶。這些數據,聽聽就好。
實際上,雖然搜狗地圖的知名度,遠不能跟輸入法、搜索和瀏覽器相比,但始終是搜狗內部業務中不可或缺的一環,否則很難解釋這樣一個「買來的」業務,已經讓很多用戶忘記了「來路」。
老一輩網際網路從業者和用戶或許有所了解,搜狗地圖也並非完全來自搜狗內部的創造孵化。
它的前身是現任搜狗地圖總經理孔祥來創立的電子地圖服務平臺go2map,可追溯至1999年,其後2005年4月,Go2map被搜狐全資收購,成為現在的搜狗地圖,孔祥來也進入搜狗,成為地圖業務的負責人。
在此前的地圖導航競賽中,搜狗地圖一度有機會。在2008年,它是北京奧運的官方合作夥伴,在2011年,它已面向移動端推出了路況導航產品,直至2015年5月,官方披露的數據中,手機客戶端的激活用戶還有1.5億,總量排名第三。
但後來的故事我們都知道了,隨著阿里收購高德,百度加碼O2O,手機地圖的競爭逐漸成為B和A的競技場,二者搶佔了更多的市場份額,在整個移動網際網路時代,百度和高德為誰是第一,打了整整一個時代。
至今,雙方圍繞市場份額和排名,依舊口水仗不斷,難解難分。
【完】
,