新四季網

微軟小冰聊天機器人時代

2023-04-02 11:02:21 2

雷鋒人工智慧技術回顧:在2018年EMNLP大會上,微軟首席科學家吳偉、北京大學副教授嚴瑞對近年來聊天機器人的研究成果進行了全面總結,並展望了聊天機器人的未來研究趨勢。  

近日,在雷鋒愛學院公開課上,微軟小兵首席科學家吳偉在EMNLP大會上為大家介紹了其分享的精髓。  

微軟小兵首席科學家吳偉主要研究自然人機對話、自然語言處理、機器學習和信息檢索;為微軟小兵的第二代至第六代對話引擎提供核心算法,並帶領團隊開發第五代小兵和T的生成模型。他是第六代小兵的同情心典範。  

本次公開課主要在2018年的EMNLP大會上與北京大學嚴瑞教授分享導師分享的精髓。  

聊天機器人最近很流行,我在谷歌學者的高級搜索中做了一個小實驗,用關鍵字chatrobot搜索文章。它要求文章標題必須包含單詞chatbot。經過統計發現,標題中chatbot一詞的文章數量從2015年到2017年呈指數增長,當然,這項實驗還不完整。一些標題為對話模式的文章也涉及聊天機器人,儘管標題中沒有聊天機器人,所以我們可以想像它在學術界有多熱。  

此外,在業內,亞馬遜和Facebook也舉辦了一些比賽,如亞馬遜舉辦了兩次Alexa大獎賽,Facebook也在NIPS上舉辦了兩次聊天機器人比賽,引起了很多人的關注,同時,大公司基本上都有自己的聊天機器人產品,如微軟有小兵、蘋果等。有Siri等等。  

今天我們來談談通用聊天,它指的是微軟小兵在整個行業中的影響力。小兵於2014年在中國發布,然後在日本、美國、印度和印度尼西亞以每年登陸一個國家的速度發布。現在,它在全球擁有6億以上的用戶,產生了300多億次對話。NS。  

小兵背後的核心是對話引擎,傳統的對話引擎以任務為導向,分為以下幾個模塊:  

當然,整個過程還需要與知識庫交互:如果用戶提供的信息足夠,對話引擎需要從知識庫中為用戶找到答案;如果不足夠,需要再次向用戶詢問更多信息。  

隨著大數據時代的到來和深度學習技術的發展,會話引擎也發生了變化:語言理解、會話管理和語言生成模塊被簡化為支持端到端培訓的統計模型,這是我們今天將關注的統計模型。  

有兩種基本方法可以在學術界或行業中構建一個非任務導向或通用的聊天對話引擎:  

但Word2vec和Glove不能解決單詞變形的問題。例如,學習、學習和學習英語都表達了一個意思。但這兩種方法都將這些意義相同、形式不同的單詞視為不同的單詞,從而導致信息的冗餘或丟失,為此,Facebook研究所提出了一個FastText模型,旨在模擬單詞的變形:  

自然語言處理中的句子可以看作一個字符串,句子的表示可以通過一般的詞表示來實現。一般來說,有兩種方法:  

(有關NLP中深入學習的這些基本概念的詳細說明,請參閱00:09:00-00:25:05的視頻)  

其中,基於搜索的聊天機器人主要利用搜尋引擎的學習排名等結果,其新特點是在給定上下文和候選響應的情況下,建立匹配模型來衡量候選響應是否可用作上下文響應,目前,檢索是聊天機器人領域的一個研究熱點。機器人,以及如何利用神經網絡構造匹配模型是檢索的重點。  

I型框架具有簡單、易於實現、在線系統效率高等優點。然而,在這個框架中也存在一些問題,例如信息丟失和不容易解釋。正是這些問題促使第二個匹配模型框架——II型框架的提出。  

第二類框架的思想是,由於信息丟失源於上下文在滿足候選響應之前被壓縮成一個小的向量,因此最好讓上下文中的每個句子在開始時與候選響應交互,然後將交互信息提取到匹配的v中。然後利用RNN對匹配向量層次上的句子關係進行建模,生成匹配得分。  

二類框架的優點是能夠在匹配模型中充分存儲上下文信息,具有良好的可解釋性。然而,該框架也有一些缺點,如計算複雜度高。  

下面是我們將要在WSDM2019中做的事情。這項工作的想法是:既然我們對I型和II型做了很好的研究,並且深入學習本質上是學習,我們可以優化匹配模型的表示以進一步提高模型的性能嗎在這方面,我們的基本思想是在有如此多的表示的情況下,如何使用如此多的表示來產生一個更好的性能模型,結果表明,融合這些表示是有用的,但實現方法非常精巧:  

在用戶輸入後,系統通過自然語言的生成來合成一個響應,即機器人生成一個響應作為輸出,生成方法的基本模型是編碼器注意解碼器的結構,它借鑑了機器翻譯的思想。  

生成性對話也是當前一個備受關注的話題,相關著作也不少,但今天,由於時間有限,我只介紹這三個問題。  

那麼,為什麼會有普遍的反應呢實際上,對話是一個一對多的問題,也就是說,對一個輸入可能有許多響應,整個對話過程不像機器翻譯那麼簡單。機器人根據對話生成關聯,然後根據這些關聯合成響應。  

在此基礎上,利用神經網絡進行建模,並在編碼器和解碼的體系結構中增加了一個課題的關注點。  

在AAAI2018的一個作品中,我們對上下文進行了建模,其思想是:由於上下文具有層次結構,我們使用句子級GRU和單詞級GRU來建模單詞和句子之間的順序關係,並且還使用句子級注意和單詞級注意來生成句子,句子中的單詞和在整個上下文中分別比較了哪些句子。重要的是,除了非常好的結果外,模型還具有很強的解釋力。  

(有關AAAI2018上下文建模工作的詳細說明,請在00:58:00查看視頻。)  

最後,我們討論了如何解決對話中的解碼效率問題,我們觀察到系統的解碼效率很低,因為它需要掃描每個預測單詞的整個詞彙表,但實際上只有系統的一小部分可以用來回復輸入。  

為此,我們的想法是先用過濾器過濾掉大部分可能不相關的單詞,然後在生成的響應中只考慮剩餘單詞的一小部分,從而將靜態詞彙轉化為動態詞彙。對於每個輸入,詞彙表都是不同的。  

(關於解決解碼效率問題的具體說明,以及發電模型在印尼小兵的實際應用,請參考1:00:00的視頻。  

在聊天機器人時代,會話引擎扮演著非常重要的角色。目前,兩種主要的方法都是基於檢索和生成方法的,對它們進行了大量的研究,但實現真正的人機對話還有很長的路要走。  

同类文章
 海底一萬米有多恐怖 究竟蘊藏著什麼?

海底一萬米有多恐怖 究竟蘊藏著什麼?

海底一萬米有多恐怖,人類對九霄之上的探索已經超出了太陽系,雖然了解不是特別深但是比起深不可測海底了解已經夠深了,這是什麼原因呢?因為迄今為止世界上的潛水器也只是能最大限度到大海底的距離是6500米。巨大的壓力讓人類的身體所不能夠承受。而人類刷新的潛水記錄是113米。這與深不可測的海底相比簡直是微不足
 走近科學:星空探秘

走近科學:星空探秘

什麼是科學?科學並不是只有超導、納米、基因、航天才是科學,小到衣食住行,大到外層空間、地球深處、億萬年前、億萬年後都有科學的存在。科學在我們的生活中無處不在,它無時無刻都在影響著我們的生活,左右著我們的思維方式。《走近科學》月刊是我國第一本電視科學雜誌。它將中央電視臺科教頻道的優秀電視節目轉化為平面
 電視機品牌排行榜前十名,康佳排在第一

電視機品牌排行榜前十名,康佳排在第一

電視機排名前十名品牌有哪些?挑選電視機,當然要從聞名的品牌下手,這樣就為了保證日後的運用不會呈現任何問題,通過調查,其實有許多的顧客不知道電視機品牌詳細有哪些,那麼下面小編就帶我們去了解一下。1 康佳康佳是改革開放之後第一家中外合資企業,也是在這時康佳才開始從事電視機的出產。在電視機出產上康佳的表現
 潘洛斯階梯是什麼,真的存在嗎

潘洛斯階梯是什麼,真的存在嗎

在科學的世界裡面,只有經過實踐驗證的才是真的科學,而那些經不起科學實踐驗證的都是偽科學。偽科學的存在也說明了科學認識對於我們認識的重要性,但是偽科學也有一定的存在必要性,比如說偽科學的存在可以讓我們認識到科學存在的重要性。潘洛斯階梯是什麼;潘洛斯階梯(PenroseStairs),又名潘羅斯階梯,由
 海底火山為什麼不會被海水撲滅

海底火山為什麼不會被海水撲滅

人類能看到陸地、海島上的火山噴發,而海底火山被厚厚的海水所「覆蓋」,為什麼也會被人們看見呢,火山附近為什麼還會有人住?海底火上為什麼海水不能撲滅,日本火山為什麼那麼多呢。海底火山的介紹:海底火山又叫平頂海山或是海底山。海底火山,是大洋底部形成的火山。海底火山的分布相當廣泛,海底火山噴發的溶巖表層在海
 盤點太陽系八大行星,它們離太陽有多遠?

盤點太陽系八大行星,它們離太陽有多遠?

我們生活在太陽系中,經過科學家的不斷探索與發現,我們地球是屬於太陽系八大行星之一。本來是九大行星的,後來冥王星被排除出去了。你了解這八大行星嗎?下面就和小編一起來看看吧!水星水星是一顆類地行星,由於其非常靠近太陽,所以只會出現在凌晨稱為辰星,或是黃昏出現作為昏星。除非有日食,否則在陽光的照耀下通常是
 cpu性能天梯圖,手機cpu性能天梯圖

cpu性能天梯圖,手機cpu性能天梯圖

這些年,智慧型手機商場越發的老練,對於智慧型手機咱們是越發的了解,如何挑選一款運用比較舒服的智慧型手機,現在都清楚了功能好,才能使智慧型手機擁有更好的發展的空間,不管是遊戲還是運用,沒有強大的功能支撐,到頭來只會卡的想哭。那智慧型手機的功能從而來呢?自然是由SoC晶片而來,也便是咱們常說的處理器,智
 基因工程將創造超人自然人將逐步滅絕

基因工程將創造超人自然人將逐步滅絕

英國已故科學家史蒂芬·霍金的遺作《對大問題的簡明回答》定於16日發售。昨日,《星期日泰晤士報》透露著作內容:霍金預測,基因工程可能會讓人們能夠創造出「超人」,而這些「超人」可以摧毀其他人類。霍金警告超人出現將導致自然人逐漸絕跡著名的理論物理學家史蒂芬·霍金3月14日去世,享年76歲,留下一批圍繞他所
 衛浴品牌排行榜前十名,挑選時注意什麼?

衛浴品牌排行榜前十名,挑選時注意什麼?

衛浴首要用於洗澡的衛生間,是供居住者便溺、洗浴、盥洗等日常衛生活動的空間及用品。現階段衛浴又不僅僅是單一衛浴這麼簡略,跟著人們生活節奏的加快,關於各種產品的要求進步,出現了五顏六色衛浴用品,衛浴的挑選也是很多種,那麼該如何挑選一個好的衛浴品牌呢?下面為我們引薦幾款很不錯的品牌。一、ARROW箭牌衛浴
 西方最先完成了現代化的任務

西方最先完成了現代化的任務

終結了西方模式主宰世界的線性史觀,這是一件具有世界意義的重大歷史事件,是20世紀留給人類的兩大遺產」,中國奇蹟震撼世界,而非唯一選擇,中國用短短幾十年的時間走完了西方發達國家100多年甚至幾百年走過的路,但同時也遭遇了「現代性之殤」,有責任、有義務、有能力推動全球治理體系朝著更加公正合理的方向發展,