京東技術破局:「語音購物」重新定義電商
2025-05-11 23:54:08
著名的網際網路預言家,凱文·凱利在今年的多個公開演講中,都談到了人工智慧將會是未來社會格局的改變者。他甚至認為,人工智慧有可能重新定義人類。
當然,這種理解本身並不是在渲染,人工智慧對人類智能的超越,我相信凱文·凱利的意思是:人工智慧的技術,在重新定義人類的生活方式。想像空間是不是很大,比如購物?
實際上,作為一位叮咚(DingDong)智能音箱的用戶,我深刻體會過語音識別技術對固有生活方式的改變,當一位 「癱」在沙發上的消費者,習慣了用語音去操控音樂的播放,天氣的查詢等一些基本的人工智慧應用後,我們當然會希望得到的更多。
就像凱文·凱利在他的新書《必然》裡總結的未來發展十二大趨勢中,所描述的幾個關鍵屬性一樣,認知(Cognitive)和互動(Interacting)正是代表著人工智慧形成了新鮮的人機互動,而語音顯然要比按鍵、滑鼠更為原始,更加真實。
那麼,如果通過人工智慧的技術,讓語音購物成為新的應用場景。這是不是可以重新定義,今天的電商呢?
京東正在打開這個腦洞
是的,京東現在正在打開這個腦洞。
最近,京東在人工智慧領域又邁出了重要的一步——在中國領先的將語音技術、電商服務、人工智慧技術以及智能硬體相結合,實現智能語音購物全流程體驗。已全面支持購物服務的叮咚(DingDong)智能音箱,有望成為萬物互聯時代京東購物的新入口。
語音購物實際上,是通過叮咚(DingDong)音箱為載體,使用簡單的語音指令來便捷查詢訂單狀態、物流相關信息,隨時知曉商品送達時間,查詢搜索用戶關注商品的優惠、活動信息,輕鬆網羅京東的低價好物;同時,叮咚(DingDong)音箱還可根據用戶在京東商城的訂單記錄、關注瀏覽、用戶畫像等大數據,為用戶個性化智能推薦商品。用戶可通過最快捷、最智能的語音交互下達確認購買的指令,方便高效地完成購物下單。
那麼,語音購物的流程在技術上,有哪些關鍵點?我們逐一來解讀一下。
首先,需要從多個領域對用戶語音輸入進行分析和理解,按照場景進行分類(購買商品,查詢訂單,點餐,知識問答等);然後更加深入的對輸入做細粒度的分析和理解,不僅要知道這是一個下單指令,還需要理解到用戶的購買需求。通過這兩方面技術結合達到多層次的精確語義理解。
其次,多輪對話能力。由於語義理解比一問一答的搜索技術要更複雜和困難,針對購物,音箱採用的AIUI技術可靈活的實現多輪人機互動,來了解用戶購物需求,從而幫助用戶快速選定商品並完成下單。由於,很多場景的對話是不能通過做一輪交互來完成的。所以,需要根據上下文、用戶的使用偏好和購買習慣做更為精準的引導和推薦,這種智能的應答,一直是技術上的難點。
最後,是遠場識別技術。這個技術是基於硬體基礎,目的是為了抑制用戶語音之外的噪聲和混響效應。做到在95%以上的場景中可以有效地進行遠場拾音一直是個技術難點。而叮咚(DingDong)音箱則融入了科大訊飛的遠場識別技術,讓語音購物的體驗得到保障。
我們知道,不久前,美國亞馬遜推出了Echo音箱,谷歌推出了Google Home。兩者均都瞄準了家庭入口的位置,而叮咚(DingDong)作為國內率先上線語音購物功能的家庭助手,顯然已經將入口布局更加深入。
這也是語音購物的意義所在,因為語音交互只是人機互動的第一步,而在叮咚(DingDong)音箱的背後,則是京東大數據、智能雲平臺的優勢整合,將先進的語音技術、自然語意理解、電商服務和創新硬體相結合,最終才演變成了語音購物這一應用場景的誕生。
更適用於家庭場景的「主動」模式
毫無疑問,語音購物就是針對家庭的應用場景的。
首先,必須承認,因為語音對條件的要求相對是比較苛刻的,噪音或者雜音對它的應用會產生很大的影響。但是在家庭環境相對來說是比較可控一點的,所以家庭的場景是比較切合的。
其次,不同於雙11那種集中爆發式的購物,其實購物的本質就是日常生活所需,比如說洗髮水用完了,需要補充,或者家裡的衛生紙、油鹽醬醋需要購買,圍繞這些最基本的購物需求,完全可以直接通過語音購物來實現。
第三,家庭的應用場景下,我們可能會同步進行不同的操作。比如,一邊看電視一邊掃地,或是一邊做飯,一邊聽歌。家庭的應用場景中,這種同步的模式最為常見,也就是說我們會遇到很多無法面對顯示屏的應用場景,這就為語音購物提供了鮮活的場景。比如,掃著地,通過語音購物的方式,完成對一瓶洗髮水的購買。
本質上,語音購物不是簡單「語音處理、理解技術」和「交易系統」簡單結合問題,而是需要針對語音的特殊場景,對基於屏幕的交互體驗流程進行相應調整,以適應語音購物場景。
過去,我們常談論智能家居的入口,其實很多應用場景都是被動的。比如,對智能燈泡、空調、電視等家電的控制,每一個設備都渴望成為入口,所以標準林立,沒有誰希望主動被「控制」。
但是語音購物卻不一樣,購物的需求是客觀存在的,語音購物的應用場景是從根本上,解決了無屏化購物的痛點。而我認為這種主動的方式,更容易讓用戶產生信任感和粘合性。從這個角度看,叮咚(DingDong)音箱,無疑已經站在了行業的領導地位。
從語音購物看京東的人工智慧格局
不久前,劉強東在京東未來12年的戰略規劃中提到,「京東會進一步走向開放,將已有的供應鏈、數據、物流優勢充分向社會開放,帶動全行業、全社會效率的進一步提升,成為中國商業零售領域基礎設施的提供商。同時,將通過AR/VR技術、深度學習、人工智慧、機器人自動化等創新科技」。
事實上,劉強東已經不止一次的談到京東在智能電商上的發展思路。而語音購物則可以看作是京東在利用人工智慧技術改變電商的又一次有力的探索。
京東在利用人工智慧技術推動電商轉型也是不遺餘力。比如,加入了人工智慧技術之後,可以做到自動尋址的無人機物流;基於場景化購物,融合門箱互拍、圖像識別、RFID識別、光譜分析等識別技術的智能冰箱;結合用戶畫像主動的進行關懷交流,從售前到售後對用戶體驗給予改善的JIMI機器人;利用京東大數據推出的動態定價和個性化推薦工具;利用圖形識別技術的拍照購;再有京東對VR購物的研發和創新,形成了京東整體,基於人工智慧的布局。
所以,在語音這種交互方式背後,其實是京東人工智慧技術的綜合體現。京東也將在人工智慧,特別是自然語言的語義理解領域繼續深耕,將京東自有的強大電商優勢與人工智慧技術密切結合,為用戶提供更加簡單快樂的生活體驗。
從未來的想像空間看,京東未來將採用人工智慧技術,不斷提升語音交互的能力,創造更加自然、智能的交互體驗,以及深化京東大數據的應用,為用戶提供更精準、更個性化的購物服務。另外,在叮咚(DingDong)上正在接入多樣的第三方服務,未來打造開放服務平臺,讓用戶使用語音即可非常便捷的獲取各種各樣的服務。這也將是京東的又一個開放的平臺,未來的語音購物,不僅可以在叮咚上實現,還可以在接入京東智能雲的多種智能設備上來實現。
總體而言,小小的音箱背後是京東人工智慧的大格局觀。正如劉強東的判斷一樣,「未來的零售將全面智能化」,而語音購物則像是一個支點,輕輕的撬動了現在與未來的平衡。