史上首次！外媒：AI在多人撲克比賽中勝過人類

2019-07-15 02:46:49 來源：參考消息評論：0 [收藏] [評論]

導(dǎo)讀：　　美國《科學(xué)》周刊11日發(fā)表的一項(xiàng)研究顯示，由臉書公司和美國卡內(nèi)基-梅隆大學(xué)共同研發(fā)的人工智能(AI)系統(tǒng)Pluribus在六人制德州撲克比賽中擊敗了5名職業(yè)選手。　　據(jù)埃菲社7月11日報(bào)道，這是當(dāng)前唯一一個(gè)在多人

　　美國《科學(xué)》周刊11日發(fā)表的一項(xiàng)研究顯示，由臉書公司和美國卡內(nèi)基-梅隆大學(xué)共同研發(fā)的人工智能(AI)系統(tǒng)“Pluribus”在六人制德州撲克比賽中擊敗了5名職業(yè)選手。

　　據(jù)埃菲社7月11日報(bào)道，這是當(dāng)前唯一一個(gè)在多人比賽中表現(xiàn)勝過人類撲克選手的AI系統(tǒng)。在此之前，在撲克比賽中擊敗人類是少數(shù)AI未能完成的挑戰(zhàn)之一。

　　報(bào)道稱，對于AI系統(tǒng)而言，撲克具有諸如國際象棋等其他游戲不具備的難點(diǎn)，那就是“信息不對稱”：由于桌面上的一些牌始終背面朝上，玩家只能了解游戲進(jìn)程的一部分。因此，想要獲勝就必須理解和猜測其他玩家的行為，這其中包括辨別對手什么時(shí)候是在虛張聲勢以及自己通過虛張聲勢的做法欺騙對手。

　　在實(shí)驗(yàn)中，該研究報(bào)告作者圖奧馬斯·桑德霍爾姆和諾姆·布朗采用“行動抽象”和“信息抽象”技術(shù)，減少AI在一局游戲中需要考慮的行動。

　　據(jù)他們介紹，強(qiáng)化學(xué)習(xí)系統(tǒng)和新算法的結(jié)合是機(jī)器能夠戰(zhàn)勝人類的關(guān)鍵。這款由他們與臉書共同研發(fā)的名為“Pluribus”的AI系統(tǒng)，在一次又一次與自身副本的對抗中學(xué)會了如何在六人制無限制德州撲克比賽中獲勝。

　　在與副本進(jìn)行游戲的過程中，該AI系統(tǒng)生成了一套既定策略，科學(xué)家們稱之為“行動計(jì)劃”。而在與真實(shí)的對手比賽時(shí)，Pluribus會通過尋找其他對于應(yīng)對當(dāng)局游戲而言更有效的即時(shí)行動來改進(jìn)這套既定策略。

　　事實(shí)上，Pluribus的算法做出的一些反饋甚至讓它的開發(fā)者感到驚訝。大多數(shù)職業(yè)撲克選手會避免一種明顯不合邏輯的下注方式(在術(shù)語中被稱作“驢式下注”)，其唯一的目的是擾亂在游戲中居主導(dǎo)地位的玩家。然而，Pluribus會相對頻繁地使用這種下注方式。被它擊敗的職業(yè)選手之一達(dá)倫·伊萊亞斯說：“AI最強(qiáng)的地方在于它運(yùn)用混合策略的能力。我們?nèi)祟愡x手也想做同樣的事，但我們在執(zhí)行上存在問題。以完全隨機(jī)的方式持續(xù)進(jìn)行這種操作非常難。”

　　桑德霍爾姆指出，在此之前，在戰(zhàn)略思維方面超越人類的AI所取得的重大成就僅限于二人對決，但在如此復(fù)雜的游戲中擊敗5名玩家的能力為利用AI解決現(xiàn)實(shí)世界中各種各樣的問題提供了新機(jī)會。

分享到：

責(zé)任編輯：zsz

更多相關(guān)搜索：