議題背景

今年當紅的Netflix影集《后翼棄兵》(The Queen’s Gambit),英文劇名指的就是下西洋棋時用的一種開局法,藉由犧牲一些重要棋子才能取得勝利。現實生活中,不只人類會下棋,AI也會。從1997年IBM的超級電腦戰勝俄羅斯西洋棋棋王,到2017年人工智慧軟體AlphaGo戰勝人類圍棋選手,都持續引起大眾關注及討論。

但是,我們除了驚豔於AI強大的下棋能力之外,是否還可以期待這種技術可以幫助人類的棋弈遊戲?對此,專家回應如下:

專家怎麼說?

2020年12月14日
東華大學資訊工程學系教授 顏士淨

AI對圍棋界和遊戲的影響

自2016年AlphaGo擊敗南韓棋王後,衝擊最大的當然是圍棋界。圍棋界乃至於電腦圍棋界,必須要面對人工智慧擊敗圍棋人類棋王的事實。而這面對人工智慧的過程,也可做為其他即將被人工智慧淹沒的領域之借鏡。當時在圍棋界看法相當分歧,毫無疑問的,人工智慧將衝擊圍棋的文化與價值,特別是職業棋士存在的意義。例如一個以職業棋士為目標的小孩,若有人告訴他永遠不可能贏過電腦,那鍛鍊與增強棋力的決心是否就會動搖?其實,我們可以透過人工智慧,更理解圍棋的優點,享受圍棋帶來的快樂。回顧AlphaGo之後一系列AI圍棋所帶動的新聞效應,已經讓圍棋再度熱了起來,特別是Google後來又發展了AlphaGoZero、AlphaZero、Muzero[1]等可以應用在圍棋,甚至更複雜遊戲的AI系統,而讓這股熱潮得以一直持續。

目前各種棋類都有使用AI下棋的系統,可以讓人類選手與AI對弈,因為AI下棋的手法通常比較全面,人在與AI程式拆解招數的過程,可以得到很多有用的回饋。我所主持的東華大學AI實驗室在2017年起,也有提供從初學到職業的圍棋程式GoTrend,並且可以透過網際網路,讓人與GoTrend對弈練習,到2020年末為止,GoTrend系統在網路上被使用次數已經超過兩億人次。

此外,我們也與Facebook一起發展Polygames,是一個平台,研究人員只需要撰寫遊戲規則,經過Polygames架構訓練AI之後,就可以產生一個很強的AI遊戲程式,而人類可以藉由這個AI程式來練習遊戲的對戰。因為這AI程式是自我學習遊戲規則,下法(棋招)會比較全面,所以比人類更不容易有漏洞。Polygames也可以幫助更快速的發展各種遊戲程式,再給人類使用。Polygames已經在2020年發表在開源資料的平台[2],有興趣的讀者可以自行下載使用。

這技術代表AI有反思和創造力嗎?是否可以應用在其他遊戲?

AlphaGo是根據人類棋譜訓練AI的基礎神經網路[3],再以此基礎神經網路互相對弈,產生更多棋譜,從中發掘出更好的棋招。而AlphaGo Zero與AlphaGo不同,是完全由AI產生棋譜,訓練出神經網路後再互相對弈,可說是具有圍棋棋招的自我反思和創造的能力,與圍棋棋手的反思和創造力類似。上述的Polygames也是基於類似Alpha Zero的方式所設計。

以AlphaZero與Polygames的經驗來說,只要是規則定義明確的遊戲,都可以使用電腦自我反思和創造的能力來產生AI玩家或棋手,目前成功的例子包括大部分的棋類遊戲、57種雅達利(Atari)遊戲以及星海爭霸等遊戲。因此AI可以幫助開發新遊戲、讓遊戲更好玩,成為人類生活的助力。

相關利益聲明:無。

註釋與參考資料:

[1] 編註:AlphaGoZero、AlphaZero、Muzero這三個都是由DeepMind開發的AI軟體。2017年下圍棋戰勝人類的是AlphaGo,它的最新版是AlphaGo Zero;而AlphaZero則與AlphaGo Zero類似,但AlphaZero的演算法有延伸到將棋與西洋棋。Muzero演算法則可自行學習遊戲的規則和策略,能夠用在比圍棋更複雜的遊戲。

[2] 編註:Polygames公開程式碼請參考〈facebookincubator/Polygames〉。

[3] 編註:運用電腦計算的能力,發展出模仿人類大腦神經元運作的方法來解決問題,就是基礎的神經網路。

版權聲明

本文歡迎媒體轉載使用,惟需附上資料來源,請註明新興科技媒體中心。
若有採訪需求或其他合作事宜,請聯絡媒體公關:

曾雨涵

haharain331@rsprc.ntu.edu.tw
02-3366-3366#55925