Google人工智能研發(fā)實(shí)驗(yàn)室DeepMind認(rèn)為,提高人工智能系統(tǒng)能力的關(guān)鍵可能在于發(fā)現(xiàn)解決具有挑戰(zhàn)性的幾何問題的新方法。為此,DeepMind今天發(fā)布了AlphaGeometry--該實(shí)驗(yàn)室聲稱該系統(tǒng)能夠解決的幾何問題與國(guó)際數(shù)學(xué)奧林匹克金牌得主的平均水平相當(dāng)。

AlphaGeometry的代碼已于今天上午開源,它能在標(biāo)準(zhǔn)時(shí)限內(nèi)解決25個(gè)奧數(shù)幾何問題,超過了之前最先進(jìn)系統(tǒng)的10個(gè)。
Google人工智能研究科學(xué)家Trieu Trinh和Thang Luong在今天上午發(fā)表的一篇博文中寫道:"解決奧林匹克級(jí)的幾何問題是開發(fā)深度數(shù)學(xué)推理的一個(gè)重要里程碑,是邁向更先進(jìn)、更通用的人工智能系統(tǒng)的必經(jīng)之路。[我們]希望......AlphaGeometry能夠幫助我們?cè)跀?shù)學(xué)、科學(xué)和人工智能領(lǐng)域開辟新的可能性"。
為什么關(guān)注幾何?DeepMind斷言,證明數(shù)學(xué)定理,或從邏輯上解釋為什么一個(gè)定理(如勾股定理)是真的,既需要推理,也需要從一系列可能的步驟中選擇解決方案的能力。如果DeepMind的想法是正確的,那么這種解決問題的方法有朝一日會(huì)在通用人工智能系統(tǒng)中大顯身手。
DeepMind在新聞稿資料中寫道:"證明某個(gè)猜想的真假,即使是當(dāng)今最先進(jìn)的人工智能系統(tǒng)也力不從心。朝著這個(gè)目標(biāo),能夠證明數(shù)學(xué)定理......是一個(gè)重要的里程碑,因?yàn)樗故玖藢?duì)邏輯推理的掌握和發(fā)現(xiàn)新知識(shí)的能力。"
但是,訓(xùn)練人工智能系統(tǒng)解決幾何問題帶來了獨(dú)特的挑戰(zhàn)。
由于將證明轉(zhuǎn)化為機(jī)器能夠理解的格式非常復(fù)雜,因此可用的幾何訓(xùn)練數(shù)據(jù)非常匱乏。而當(dāng)今許多尖端的生成式人工智能模型雖然在識(shí)別數(shù)據(jù)中的模式和關(guān)系方面表現(xiàn)出色,但卻缺乏通過定理進(jìn)行邏輯推理的能力。
在設(shè)計(jì)AlphaGeometry的過程中,該實(shí)驗(yàn)室將"神經(jīng)語言"模型(一種在架構(gòu)上與ChatGPT類似的模型)與"符號(hào)推導(dǎo)引擎"(一種利用規(guī)則-如數(shù)學(xué)規(guī)則來推斷問題解決方案的引擎)配對(duì)使用。符號(hào)引擎可能不夠靈活且速度較慢,尤其是在處理大型或復(fù)雜的數(shù)據(jù)集時(shí)。但DeepMind通過讓神經(jīng)模型"引導(dǎo)"推理引擎找出給定幾何問題的可能答案,緩解了這些問題。

為了代替訓(xùn)練數(shù)據(jù),DeepMind創(chuàng)建了自己的合成數(shù)據(jù),生成了1億條"合成定理"和不同復(fù)雜程度的證明。然后,實(shí)驗(yàn)室在合成數(shù)據(jù)上從頭開始訓(xùn)練AlphaGeometry,并在奧林匹克幾何問題上對(duì)其進(jìn)行評(píng)估。
奧林匹克幾何問題以圖表為基礎(chǔ),在解題前需要添加"構(gòu)造",如點(diǎn)、線或圓。應(yīng)用于這些問題時(shí),AlphaGeometry的神經(jīng)模型會(huì)預(yù)測(cè)哪些構(gòu)造可能需要添加--AlphaGeometry的符號(hào)引擎會(huì)利用這些預(yù)測(cè)對(duì)圖表進(jìn)行推理,從而找出類似的解決方案。
Trinh和Luong寫道:"有了這么多這些構(gòu)造如何導(dǎo)致證明的例子,AlphaGeometry的語言模型就能在遇到奧林匹克幾何問題時(shí)為新的構(gòu)造提出好的建議。一個(gè)系統(tǒng)提供快速、'直觀'的想法,而另一個(gè)系統(tǒng)則提供更深思熟慮、理性的決策。"
AlphaGeometry的解題結(jié)果發(fā)表在本周的《自然》(Nature)雜志上,它很可能會(huì)引發(fā)一場(chǎng)曠日持久的爭(zhēng)論:人工智能系統(tǒng)應(yīng)該建立在符號(hào)操作(即使用規(guī)則操作代表知識(shí)的符號(hào))的基礎(chǔ)上,還是建立在表面看來更像大腦的神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上。
神經(jīng)網(wǎng)絡(luò)方法的支持者認(rèn)為,智能行為--從語音識(shí)別到圖像生成時(shí)可以從海量數(shù)據(jù)和計(jì)算中產(chǎn)生。與符號(hào)系統(tǒng)相比,神經(jīng)網(wǎng)絡(luò)試圖通過統(tǒng)計(jì)近似和從實(shí)例中學(xué)習(xí)來解決任務(wù),而符號(hào)系統(tǒng)則是通過定義專門用于特定工作的符號(hào)操縱規(guī)則集來解決任務(wù)(如在文字處理軟件中編輯一行)。
神經(jīng)網(wǎng)絡(luò)是OpenAI的DALL-E 3和GPT-4等強(qiáng)大人工智能系統(tǒng)的基石。但是,符號(hào)人工智能的支持者認(rèn)為,神經(jīng)網(wǎng)絡(luò)并不是萬能的;這些支持者認(rèn)為,符號(hào)人工智能可能更適合高效地編碼世界上的知識(shí),在復(fù)雜的場(chǎng)景中進(jìn)行推理,并"解釋"它們是如何得出答案的。
作為一個(gè)類似于DeepMind的AlphaFold 2和AlphaGo的符號(hào)-神經(jīng)網(wǎng)絡(luò)混合系統(tǒng),AlphaGeometry或許證明,將符號(hào)操作和神經(jīng)網(wǎng)絡(luò)這兩種方法結(jié)合起來,是尋找可通用人工智能的最佳途徑。
"我們的長(zhǎng)期目標(biāo)仍然是建立能夠在數(shù)學(xué)領(lǐng)域通用的人工智能系統(tǒng),開發(fā)通用人工智能系統(tǒng)所依賴的復(fù)雜問題解決和推理能力,同時(shí)拓展人類知識(shí)的前沿,"Trinh和Luong寫道。"這種方法可以塑造未來的人工智能系統(tǒng)如何發(fā)現(xiàn)數(shù)學(xué)及其他領(lǐng)域的新知識(shí)"。







