紙牌游戲Hanabi被Facebook的AI挑戰(zhàn),考慮到他們正在進入一個領(lǐng)域,這不僅是一個對手擊敗另一個對手的問題,而且是一個“合作”的紙牌游戲,其中競爭團隊互相幫助。
《財富》雜志的喬納森·瓦尼安(Jonathan Vanian)通過介紹游戲的方式引導(dǎo)讀者:
“ ...:兩到五名球員組成的團隊會獲得不同顏色和代表點數(shù)的隨機卡。團隊的目標是將卡按正確的數(shù)字順序按顏色分組放在桌子上。問題是,但是,玩家無法看到自己的牌,而隊友卻能看到自己的牌,玩家可以給另一個提示,例如對某種顏色進行備注,這會提示另一個人做諸如打牌或丟棄牌的事情。就是玩家必須推斷出隊友的線索意味著什么。”
企業(yè)領(lǐng)導(dǎo)者已顯示出對Hanabi的團隊建設(shè)學(xué)習(xí)經(jīng)驗的傾向;現(xiàn)在,它已經(jīng)引起了AI研究人員關(guān)于構(gòu)建出色AI系統(tǒng)的關(guān)注。
Engadget表示:“在不起眼的法國紙牌游戲中取得接近完美的分數(shù)非常好,除Facebook之外,其他所有人都為其合作AI制定了更大的計劃。”
Facebook研究人員湯姆·勒勒(Tom Lerer)在Engadget中被引用:“我們正在尋找的是人工代理,它們可以更好地推理與人類和聊天機器人的協(xié)作交互,并可以推理與他們聊天的人為什么說他們所做的事情。 ..Chatbot可以更好地說明人們?yōu)槭裁凑f自己所做的事情而不必枚舉他們所要求的所有細節(jié),這是這種搜索技術(shù)的非常簡單的應(yīng)用。
研究人員采用了哪些人工智能策略?
Vanian確定了DeepMind以前使用的一種搜索技術(shù)。它使多個Hanabi機器人可以在相互共享信息的同時評估多個播放選項。結(jié)合強化學(xué)習(xí),F(xiàn)acebook機器人學(xué)習(xí)了如何相互玩Hanabi。
這項調(diào)查背后的作者寫了一篇論文,討論他們的工作,論文發(fā)表在arXiv上(發(fā)表在《人工智能》雜志上)。“ Hanabi挑戰(zhàn):人工智能研究的新領(lǐng)域”是該論文的標題,作者說,他們將Hanabi視為“挑戰(zhàn)領(lǐng)域,其新穎的問題源于其純粹合作的游戲玩法和不完美的信息的結(jié)合(兩到三個)。五人設(shè)置。”