德撲人機大戰結果揭曉,冷撲大師九場完勝共贏79萬分
发帖时间:2025-11-02 11:53:57
導讀:德撲人機大戰AI狂虐龍之隊,冷撲大師九場完勝共贏79萬分。
今天中午,“冷撲大師V.S.中國龍之隊——人機撲克巔峰表演賽”落下帷幕。經過五天賽事,冷撲大師最終以792,327總記分牌的戰績獲勝,並獲得200萬獎勵。
這場關於德州撲克的“人機大戰”由李開複發起,對戰雙方一方由由六位華人頂尖撲克選手組建,隊長杜悅曾在世界德州撲克大賽WSOP的無限注德州撲克賽事中獲得冠軍。
另一方是美國卡內基梅隆大學托馬斯?桑德霍姆教授開發的Libratus(“冷撲大師”)。Libratus在今年1月11日至1月30日一對一無限注德州撲克比賽中,曾擊敗四名頂尖人類高手。
五天下來冷撲大師累計贏得792,327記分牌數,平均22.0每百手損失大盲
比賽前,李開複就曾預言,人類代表隊的勝算也隻有10%。而麵對今天中午的最終結果,李開複也表示:“透過冷撲大師和龍之隊表演賽的對戰結果,人機對戰基本沒有懸念了,據聞AlphaGo近期即將來華和柯潔對戰,其實已經不再具有科學意義了。”
在此次比賽和1月匹茲堡的兩次德撲人機對戰中,Libratus和冷撲大師在三個主要技術模塊中都使用了新的算法:包括比賽前采用近於納什均衡策略的計算(Nash Equilibrium strategies)、每手牌中運用終結解決方案(Endgame Solving)、以及根據對手能被識別和利用的漏洞,持續優化戰略打得更為趨近平衡。
這也是冷撲大師在後程越來越凶悍,讓人類玩家難以抵擋的原因之一。在五天的巔峰表演賽中,冷撲大師和中國龍之隊雙方共完成了36,000手牌,每天鏖戰10個小時。
在談到五天的比賽感想時,中國龍之隊隊長杜悅說,“人工智能在對戰時不會受到情感、心理、體能等因素影響,且強大運算能力遠超人類大腦,不得不承認冷撲大師很多手牌打得令人拍案叫絕”。
李開複也坦言,“我認為,未來的人工智能領域不再是幾個小夥伴就可以打天下的時代了,而是需要頂尖的人工智能科學家、海量數據、強大的運算能力、以及清晰行業應用幾大閉環。”
積分差距
事實上,圍棋和德州撲克代表了AI處理人機對弈的兩種信息模式——完美信息和不完美信息。在博弈論中,完美信息指後參與者可觀察到前參與者的行為。不完美信息指參與者做選擇的時候不知道其他參與者的選擇。
德州撲克是信息不對稱的博弈,每個選手隻能看到自己的手牌——這就決定了人工智能首先需要麵對大量不完整的信息。
不同於AlphaGo,Libratus不需要提前背會大量棋譜,也不局限於在公開的完美信息場景中進行運算,而是從零開始,基於撲克遊戲規則針對遊戲中對手劣勢進行自我學習,並通過博弈論來衡量和選取最優策略。
因此,李開複也表示,冷撲大師對戰龍之隊這場人工智能的裏程碑事件將推動人們對於人工智能的認知。
人機撲克對戰中,我們看到了在爾虞我詐、概率不確定、非完美信息需要推理和情商的遊戲裏,機器一樣可以獲勝,而類似的場景在真實世界中比比皆是。人工智能已經不再隻和AlphaGo對標,人工智能已從不完美信息的處理,進步到對不完美信息海量信息運算,並具備了推理和學習能力。
他強調,“我期待下一個更加高明的AI大師級應用登場,而我更願意相信,這些應用會來自優秀的年輕創業者,而不是諸如BAT等的科技巨頭黑洞”。