新四季網

自我編碼的AI算法即將到來(解決數學難題的AI模型)

2023-04-13 14:33:14 1

當前,機器學習模型在解決微分方程等高難度數學問題方面一直存在很大限制,一些最好的模型也只是勉強回答高中水平的數學題目。

但現在,麻省理工學院(MIT)領導的研究小組開發的一種神經網絡模型,可輕鬆應對相當於大學數學課程難度的問題。

(來源:MIT)

8 月 2 日,相關論文以《一個通過程序合成和人類層面的小樣本學習的神經網絡來解決、解釋和生成大學數學問題》(A neural network solves, explains, and generates university math problems by program synthesis and few-shot learning at human level)為題發表在 PNAS 上。

MIT 電氣工程與計算機科學系講師伊多·德羅裡(Iddo Drori)擔任第一作者兼通訊作者,他也是哥倫比亞大學計算機科學系的兼職副教授。

「我們的研究是第一個解決本科數學問題的工作,這填補了使用代碼和程序合成的缺失部分,並使得準確率從 8% 提高到 80% 以上。」德羅裡在 MIT 官網上說。

該研究將有助於改善高等教育現狀,新模型對學生和老師都能有所幫助。它能建立問題和課程的圖表,基於數據的角度,助力理解課程及其先決條件之間的關係。

除了解答數學問題,新模型還能作為「機器導師」,向學生展現題目解答所涉及的步驟,並且快速生成新問題。同時,它還可以對課程內容進行簡化,這可在大型開放式網絡課程領域發揮重要作用。

據了解,研究人員在這項工作上花費了近兩年。他們最開始發現,模型只接受文本數據訓練的話,它回答高中水平數學問題時的錯誤率基本都在 92% 以上。

而那些利用圖神經網絡的模型經過一段時間訓練後,能更好地解決機器學習課程問題。

然後,德羅裡決定嘗試將 MIT 和哥倫比亞大學的數學課程轉變為相應的編程任務,這一過程用到了程序合成和小樣本學習技術。

▲圖 | (A)麻省理工學院、哥倫比亞大學數學課程和(B)MATH 基準數據集的自動求解率比較(來源:PNAS)

把一個問題變成一個編程任務,類似於將「找到兩點之間的距離」問題重寫為「編寫一個找到兩點之間差異的程序」,或者提供一些問題-程序對作為示例。

值得一提的是,相較之前只接受文本訓練的神經網絡(如 GPT-3),這一次,研究人員使用了由 OpenAI 製作的名為 Codex 的模型,該神經網絡除了在文本上訓練,也在 GitHub 存儲庫中的上千兆字節代碼上做了「微調」。「微調」本質上是另一個預訓練步驟,可以提高模型的性能。

由於 Codex 的訓練數據有著數百萬個文本單詞和數百萬行代碼,因此它能夠較好理解文本段和代碼段之間的關係,並將兩者進行轉換,從而通過代碼回答問題。

▲圖 | 用 Codex 回答和生成課程題目的自動工作流示例(來源:PNAS)

值得注意的是,有時在將數學問題轉化為編程任務時需要添加上下文(背景知識)或一些基本的定義解釋,比如,對於問題中的「網絡」一詞,需要向模型標註該詞代表「神經網絡」,並不是指「社會網絡」。

另外,可能還需要讓它知道具體該使用哪個編程包。只有這樣神經網絡才可以正確處理問題,並輸出超過 80% 的正確答案。

同時,在模型創建新的數學問題方面,德羅裡在 MIT 官網表示:「在用新模型生成某些方面的問題時,它的表現讓我們感到驚訝。它並不是單純通過替換已有問題中的值來生成新問題。比如,在一個水平線和垂直線的量子檢測問題中,模型生成了對角線量子探測的新問題。」

此外,研究團隊還分別把模型和人類出的數學題(各 5 道)讓學生去判斷,看他們是否可以區分兩者。結果顯示,學生無法確定哪個問題具體是由 AI 產生的。

最後,在藉助機器學習解決越來越困難問題領域,該研究又向前走了一步。不過,儘管模型的準確率已經非常高,但它永遠不會百分百準確,而且總會有人提出一個更難的問題,它不會取代人類。這項工作在高等教育方面或可起到重要作用。

該團隊還計劃繼續擴展該工作以突破一些限制,比如,進一步用可視化組件解決問題和提高問題的難度。此外,還會讓模型接受幾百門課程的訓練,通過大量數據讓其性能加速增強,從而能夠對課程設計提出更好的見解。

參考資料:https://news.mit.edu/2022/machine-learning-university-math-0803https://www.pnas.org/doi/10.1073/pnas.2123433119

,
同类文章
葬禮的夢想

葬禮的夢想

夢見葬禮,我得到了這個夢想,五個要素的五個要素,水火只好,主要名字在外面,職業生涯良好,一切都應該對待他人治療誠意,由於小,吉利的冬天夢想,秋天的夢是不吉利的
找到手機是什麼意思?

找到手機是什麼意思?

找到手機是什麼意思?五次選舉的五個要素是兩名士兵的跡象。與他溝通很好。這是非常財富,它擅長運作,職業是仙人的標誌。單身男人有這個夢想,主要生活可以有人幫忙
我不怎麼想?

我不怎麼想?

我做了什麼意味著看到米飯烹飪?我得到了這個夢想,五線的主要土壤,但是Tu Ke水是錢的跡象,職業生涯更加真誠。他真誠地誠實。這是豐富的,這是夏瑞的巨星
夢想你的意思是什麼?

夢想你的意思是什麼?

你是什​​麼意思夢想的夢想?夢想,主要木材的五個要素,水的跡象,主營業務,主營業務,案子應該抓住魅力,不能疏忽,春天夢想的吉利夢想夏天的夢想不幸。詢問學者夢想
拯救夢想

拯救夢想

拯救夢想什麼意思?你夢想著拯救人嗎?拯救人們的夢想有一個現實,也有夢想的主觀想像力,請參閱週宮官方網站拯救人民夢想的詳細解釋。夢想著敵人被拯救出來
2022愛方向和生日是在[質量個性]中

2022愛方向和生日是在[質量個性]中

[救生員]有人說,在出生88天之前,胎兒已經知道哪天的出生,如何有優質的個性,將走在什麼樣的愛情之旅,將與生活生活有什么生活。今天
夢想切割剪裁

夢想切割剪裁

夢想切割剪裁什麼意思?你夢想切你的手是好的嗎?夢想切割手工切割手有一個真正的影響和反應,也有夢想的主觀想像力。請參閱官方網站夢想的細節,以削減手
夢想著親人死了

夢想著親人死了

夢想著親人死了什麼意思?你夢想夢想你的親人死嗎?夢想有一個現實的影響和反應,還有夢想的主觀想像力,請參閱夢想世界夢想死亡的親屬的詳細解釋
夢想搶劫

夢想搶劫

夢想搶劫什麼意思?你夢想搶劫嗎?夢想著搶劫有一個現實的影響和反應,也有夢想的主觀想像力,請參閱週恭吉夢官方網站的詳細解釋。夢想搶劫
夢想缺乏缺乏紊亂

夢想缺乏缺乏紊亂

夢想缺乏缺乏紊亂什麼意思?你夢想缺乏異常藥物嗎?夢想缺乏現實世界的影響和現實,還有夢想的主觀想像,請看官方網站的夢想組織缺乏異常藥物。我覺得有些東西缺失了