機器人參加高考?高考機器人研製方:高考不是最終目標
2023-03-29 16:14:33
6月7日下午,人工智慧系統準星AI-MATHS挑戰中國高考數學試題,這是國內機器人首次舉行公開測試,AI-MATHS是我國863計劃中的「超腦計劃」牽頭研製的機器人,誕生於2014年。
「高考機器人」是國家863計劃信息技術領域「基於大數據的類人智能關鍵技術與系統」項目的重要研究目標之一。該「類人智能」項目於2015年7月21日由國家科技部正式啟動,成為我國在人工智慧技術領域新一輪創新的重要起點。
科技部楊鹹武副司長曾表示,項目的最大意義是凝聚了國內從事人工智慧方向研究的頂級專家,研製考試機器人將會是本項目的代表性成果之一,未來期望項目成果能進一步向各行業廣泛推廣,提升國內人工智慧及信息產業的整體發展水平。
該項目以科大訊飛為牽頭單位,聯合清華大學等30餘家科研院校和企業,主要針對大數據所帶來的新的技術與挑戰,研究相關類腦計算關鍵技術和類腦答題系統,研製出能夠參加高考並考取大學的智慧機器人。
參加高考不是根本目標
「三年前人工智慧對大眾來說還是一個非常陌生的概念,所以當時科技部專門通過這個項目聚集國內一些優秀的研究單位一起做攻關還是非常有前瞻性的。」6月6日上午,作為該項目牽頭單位和項目成果沿途下蛋、應用落地的主要承擔單位。
為什麼選擇高考作為目標?吳曉如表示,讓機器人參加高考並不是項目的根本目標,只是人工智慧本身就是對人類智能的一種模擬、擴展和延伸。「高考是很好的衡量人知識水平、理解能力、推理能力等相關智能能力水平的測試工具。
高考的試卷中蘊含人工智慧方面經典且困難的問題,包括了題目理解、知識表現、邏輯推理、人機互助的方式獲得知識,讓機器學會表達符號邏輯等。所以聚集科學家對一些人工智慧問題進行攻關,產生一批成果,看看機器能達到一個什麼樣的人工智慧水平,然後在更多領域去應用這些成果。
吳曉如介紹,機器人答題有兩種主要方式:第一,人工智慧推理和運算的方式。這是國家863類人答題機器人項目的實現方式,也是通過這一路徑,真正實現人工智慧技術的突破進展。第二,通過搜索的方式,在海量的題庫裡,搜索已有答案,進而得出題目的答案,這並不能算是人工智慧。
可見,通過強化學習能力,「高考機器人」通過建立模型和算法,將具有邏輯推理能力。
科大訊飛同時也是863「類人答題」機器人項目的測試組織單位,吳曉如說,根據國家科技部的要求,客觀評價機器人參加高考的水平首先要有完全可監督的第三方的人對整個過程監督和處理;其次,參加考試的機器人也要確保處於完全斷網的環境;第三,測試試卷必須是原創的新題。並且,實際操作中還必須把整個測試過程的日誌,即機器上所輸出的詳細的中間處理過程全部要輸出,以便確認這是完全由機器自動一步一步求解而來的答案。
機器人寫作文與人仍有不小差距
2014年科大訊飛承擔了「類人智能」項目,並提出「機器人通過高考考上一本的目標。「目前來說我們這個目標還沒有變化。」
6日,科大訊飛研究院院長胡國平介紹,國家863計劃由語文、數學、地理和歷史四門學科同時進行研發。自設定高考目標後,項目組30個團隊針對不同的問題成立了公關組:有的做知識獲取和支持,有的做知識圖譜構建,有的利用知識圖譜去求解題目,有的專門突破題意理解,還有的專攻文言文。
「過去的兩三年裡面,所有項目組都取得了相關核心技術的進步。而且中間有很多的技術成果已經在開始的相關的一些行業裡面已經形成應用了。」胡國平說,數學相對容易些,所以進展比較快。
詳細來說主要有兩方面的原因:一是數學題目的語言理解相對比較容易,有較多標準化、結構化的描述語言或出題語言,所以機器較好理解;二是有一定基礎。幾十年前就已經有做得比較好的定理、自動證明等一系列的研究成果,可以在高考機器人中發揮作用。而數學科目的最大的難點還是在一些類似應用題上,涉及到一些常識理解,這方面其實也還是有較大的短板。
「語義理解方面,其他三門語文、歷史、地理正面對著更複雜的情況,在一些深度的知識表現和深度的語音理解方面還需要進一步的技術突破。據我們之前幾次內部的測試來說,目前機器人錯的最多的題型還是地理和歷史學科中需要多個輪次知識推理解析的題目。」
不過,就總體來說,胡國平表示,對完成預定目標還是有信心。6日,他向澎湃新聞表示,語義理解方面大概有四五個攻關組在研究,包括最開始的規則、語法分析與遺傳分析以及機器翻譯。「其實在數學上我們就嘗試過用機器翻譯的方式,來實現自然語言的語義和句子的真實性理解。
這樣用機器能理解的語義的轉換工作總體來說還是一個難題,並沒有真正的突破,只是數學上做得相對比較好,在地理歷史和語文上現在有了很好的進展,但還沒有真正達到突破這種概念。」
而關於作文考題,胡國平表示,目前要機器人寫一篇具有說服力的議論文,和人相比還是有差距的。現在機器人寫作文基本上是以不停的往外擴展的方式來實現。簡單來說就是拿到一個題目之後,基於這個題目去擴展出來一些概念的詞彙,然後再擴展到概念的句子,再由這些句子通過一個排序算法來重新進行排序,最後組織形成一篇文章。
整個自動作文的效果從具體層面可以看出都很好,但在篇章裡看起來還是會有一些表達上的不連貫。這種篇章級的語義理解,或者說連貫性目前還在努力解決中。
至於何時組織機器人參與高考相關技術測試?胡國平表示,根據科技部項目辦的要求,預計將在2019、2020年會做最後成果的測試。吳曉如則表示,技術在動態的變化,考試的題目也在動態的變化,要完成這個目標還是存在很多技術上的挑戰,這就要項目組成員做更多的努力。
推薦閱讀: