百度助開發者享受最前沿技術
2024-01-24 05:36:15 2
十年前,更多的是中國製造,而十年後的今天,中國創造已經逐步走向了前臺。最近,在全球知名科技媒體TechCrunch首次在中國舉辦的2013國際創新峰會上,百度深度學習研究院常務副院長餘凱,介紹了百度基於大數據創新的深度學習模式,在語音技術和人臉識別等方面產生的巨大推動力,以及當這種能力開放給廣大開發者時,所產生的巨大能量。餘凱表示,「在中國正在發生的不僅是微創新,也不僅是業務模式的創新,而是中國領先的網際網路企業和廣大開發者一起追逐網際網路的浪潮之巔。」(餘凱在大會現場做主題演講)
餘凱在大會現場表示,在移動網際網路時代,智能可穿戴設備將會是未來的一大熱點。這其中人機互動的效率和質量,是設備「智能成色」高低的關鍵。「所有的交互方式中,最自然的人機互動方式之一是語音。」餘凱強調。因此,無論是國外還是國內,語音技術如今都成為了最頂尖的科技公司的一大投入點。餘凱頗有信心地表示,「百度是在移動搜索中文語音識別裡面做得最出色的公司,在準確率上百度跟國際同行比起來可以說是毫不遜色。」
餘凱介紹說,對於這一領先的語音技術,百度並沒有「獨享」,而是把其完全開放。實際上,在此之前百度就已經宣布向開發者免費開放百度整個語音生態系統。這樣的開放包括直接安裝百度語音助手、調用百度語音助手SDK以及開放最底層的語音識別技術API等由淺入深的三個層次。由此不同層次的開發者都可以方便快捷地使用、嫁接百度的語音服務。
除了語音技術之外,在現場餘凱還通過生動的案例,詳細介紹了百度在圖像技術方面所取得的成就,包括以圖搜圖、圖片翻譯、人臉識別、為你寫詩等基於圖像技術的創新功能。針對一個例子,餘凱表示,「百度圖像技術不但可以識別出這幅圖的內容是街頭藝人,把其灑脫的心境用中國詩歌描述出來,這說明百度對圖像識別的理解和語言模型的建模都達到了一個相當的高度。」
當百度把自身領先的圖像技術能力,植入具體產品時,就給產品帶去了不一樣的創新和獨特的賣點。百度魔圖,就是這樣的受益者。通過「PK大咖」、「夫妻臉」等功能,百度魔圖一度在 App Store 所有免費應用的綜合排名中奪得冠軍寶座,用戶數也快速地突破了1億。
實際上能夠有望創造這樣奇蹟的,並不僅僅局限於「百度系」的產品。因為百度圖像技術同樣向廣大開發者進行了開放。餘凱介紹說,通過人臉服務SDK、人臉服務API、圖像處理SDK等各種方式,百度可以向開發者開放人臉驗證、人臉檢索、人臉屬性識別、圖像處理四種技術能力。從而使得開發者可以低成本高效率地,開發出優質的產品,為用戶提供更為良好的使用體驗。
在餘凱看來,百度之所以能夠在語音、圖像等領域取得如此巨大的成績,與百度在技術領域的底層建設——百度深度學習研究院的建立息息相關。餘凱介紹說,深度學習是機器學習研究中的一個新的領域,核心在於以人腦複雜神經網絡的方式,模仿人腦的機制來解讀文本、語音、圖像等大數據。餘凱表示,「用戶所有的瀏覽和使用行為,都需要複雜的機器學習模型做預測。深度學習可以站在使用者的角度去分析所有的問題,使我們的搜尋引擎更加的智能。」
餘凱透露,在深度學習技術的驅動下,百度在各方面都取得了長足的進步,可謂影響深遠。語音技術方面,相對錯誤率降低了25%以上,移動搜索中文語音識別率突破了90%;圖像技術方面,人臉識別技術世界領先,同時快速推出了世界上首個全網人臉搜尋引擎;在相似圖像搜索方面,效果遠遠超過了國際上搜尋引擎同類產品;此外,在全流量上線廣告CTR的預估方面,也提升顯著。「深度學習之於百度,還在顯示出厚積薄發的威力。」餘凱強調。
據了解,此次2013國際創新峰會由TechCrunch中國官方戰略合作夥伴動點科技主辦。作為全球最重要的創新峰會之一,本次峰會雲集了眾多顛覆性的創業公司,同時包括TechCrunch全球COO內德?德斯蒙德、聯合創始人凱斯?提爾等業界大佬也悉數到場,和中國網際網路行業的從業者一起,共同見證當下中國的創造與創新。
餘凱最後表示,創新是中國網際網路行業發展的最大推動力,開放共享是網際網路最重要的精神內核之一,百度希望通過開放不斷地輸出自身的領先技術,幫助廣大開發者和創業者站在世界網際網路的前沿,和百度一起書寫更多神奇的中國創新故事。■