AlphaGo志不在贏棋 而在助人

作者:苑舉正(台大哲學系教授)

所有做投資的人都應該要讀哲學。《苑文其詳》首次結集出版。購買請點

2016年,在深藍公司所推出的專門下圍棋的人工智慧軟體AlphaGo,以4:1的成績,打敗韓國棋王李世乭。這條消息受到全球28億人的關注,其詳細情況有35000多條的報導!

大家都在震驚之餘,想要知道兩個問題的答案:第一,它是怎麼做到的呢?第二,它要幹什麼呢?

AlphaGo想做什麼?

由於人工智慧是一項非常專業的先進技術,因此,若不是深藍公司,也就是Google收購的人工智慧開發公司的工程師,是沒有能力回答這兩個問題的。

還好,AlphaGo的設計人哈薩比斯(Demis Hassabis)於4月份,在母校劍橋大學演講45分鐘,回答了這兩個問題。

在回答的同時,哈薩比斯先回應了兩項訊息:第一,幾個月前神祕的人工智慧程式,名稱叫大師(Master),在打敗六十幾位世界圍棋高手之後,哈薩比斯承認,這是AlphaGo的進化版本。

另外,中國棋王,年僅19歲的柯潔,將在5月23號到5月27日,與AlphaGo進行五場圍棋對決,其精彩可期,不亞於去年在韓國的對決。

當大家一致認為AlphaGo勝券在握時,哈薩比斯針對先前大家所關心的那兩個問題,做了具體的回應。這些答案不但具體,而且充滿了哲學意義,也說明了人類文明進步的契機。

圍棋比西洋棋更複雜

有一半華人血統的哈薩比斯精神奕奕地強調,圍棋的複雜度遠超過人類其他棋藝所能夠到達的範圍。例如西洋棋,它的基本玩法是固定棋子擺在棋盤上,然後逐步減少。這使得西洋棋的複雜程度,完全可以透過電腦估算,而這一點對於人工智慧的發展,並不構成什麼特別的挑戰,可是圍棋就完全不同了。

廣告

圍棋的複雜度,在每一步的影響,所導致的可能性有200種以上,而上下左右各有19條線的圍棋棋盤,形成的步數的可能性有10的170次方之多,遠大於任何天文數字。

在那麼龐大的數字下,人腦要如何做判斷,而且還能夠在下圍棋的時候分出高下呢?答案很簡單,也很令人意外,就是直覺。用直覺下圍棋是一個既簡單又複雜的答案。簡單是因為除了直覺,我們實在看不出圍棋高手的布局理由,但這又很複雜,原因當然就是因為直覺是怎麼出現的呢?

用直覺理解圍棋

哈薩比斯為了回答這個複雜的問題,到倫敦大學讀了一個腦神經學的博士。他想理解,當下圍棋時,人腦運作的方式。在配合大腦運作方式理解圍棋的時候,哈薩比斯發現了一件令人吃驚的事。

人工智慧原來的道理,就是一直不斷地以嘗試錯誤的方式學下圍棋。這是機械的,過程也不複雜,就是不犯已經犯過的錯誤。失敗了100萬次之後,AlphaGo大致已經進入了高手的境界。

這並不稀奇,稀奇的是,有時候高手直覺下的創新步數,讓AlphaGo感到困惑,並因而失去了機械學習的優勢。於是,AlphaGo只好從人下圍棋時的基本規則下手,找出只要是人下圍棋時必然會犯的錯誤。

直覺也會受限

結果,AlphaGo發現了人類3000年以來下圍棋的基本規則。其實這個規則也構成了人類在下圍棋時所形成的限制。所有的直覺均來自於這個基本的規則,然後就是接下來,各種用圍棋子占棋盤的直覺在運作。

遵循這條規則,是所有圍棋玩家的基本認知,但萬萬沒有想到,這條基本認知,雖然是圍棋真理,但是它卻不是科學真理。遵循科學真理的AlphaGo,則不受這一條人為真理的限制,這是它不斷地擊敗高手的主要原因。

當中國冠軍柯潔敗給大師時,他說:「三千多年來,我們對圍棋的理解,連其表面的皮毛都還沒有到達」,這一句話,說明了哈薩比斯的心境,但他同時也強調,AlphaGo的目的並不是為了贏棋。這令人更為好奇,因為如果AlphaGo說不求勝,但一直在贏,其目的何在呢?難道不是為了讓人類,感覺到難堪嗎?

AlphaGo打破人類文明的規則

哈薩比斯很堅決的說:「不是!」那麼我們必須問,AlphaGo打敗全世界高手的目的,又是什麼呢?哈薩比斯認為,人類在開創文明的過程中,一直面對一種慣性,只要運作好的規則,就一直持續使用,不遇到挑戰是不會修正改變它的。

圍棋這麼複雜的遊戲,唯一的規則是下第一顆棋子的位置,沒有人會否定這一條規則的事實,但也很遺憾的是,這條規則成為種下3000年大錯的教條。這是AlphaGo會贏的原因,因為在科學真理的支持下,他不受任何人為限制,反而以異軍突起的方式,讓高手稱臣,輸得心服口服。

創新思維是文明的鑰匙

哈薩比斯認為,以圍棋之複雜,人類擊敗AlphaGo卻也不是不可能的,但想要擊敗AlphaGo依靠的,不是舊思維,而是創新思維。這一點正是人類文明在科技時代力求發展的必要部分。

AlphaGo的功能,正是在逼迫人類反省,哪一些規則,需要突破,需要改變,需要修正。所以AlphaGo贏棋的策略,就像一把鑰匙,其目的不是開門而已,而是進入文明的殿堂,進一步探索在人類文明中可以真正發掘出來的東西。AlphaGo的存在目的,就是為了幫助人類進一步探求文明。

更多苑舉正教授文章,請看〈法意團隊苑文其詳專欄

★延伸閱讀★
美國哲學與川普的轉變
介於民主與獨裁之間的土耳其
瑞典與德國受到恐怖攻擊的哲學反省

【作者簡介】苑舉正

比利時魯汶大學哲學博士,台灣大學哲學系教授。曾兼任台大哲學系系主任。精通中、英、法語,台灣哲學學會副會長。1981年畢業於台灣東海大學政治系,1983年赴比利時魯汶大學哲學院攻讀哲學,獲得哲學學士(1984年)、哲學碩士(1988)以及哲學博士(1995)學位。

目前出版中英文研究論文40餘篇,專長為:科學哲學、科學方法論、社會科學哲學、政治哲學,對索羅斯的老師卡爾波普哲學有深厚研究。