MCTSの "ツリーポリシー"の実装方法について少し混乱します。私が読んだすべての論文や記事は、現在のゲーム状態(MCTS teminology:プレイヤーが動かすルート)からツリーを下って行くことについて話しています。私の質問は、私がMINのプレイヤーレベルにいても(私がMAXのプレーヤーであると仮定して)、最高の子供をどのように選ぶかです。 MINが取るかもしれない特定のアクションを選択しても、自分の探索ツリーがそのノードを通って深くなっても、MINのプレイヤーはちょうど別のノードを選ぶかもしれません(minプレーヤーがアマチュアの人間ならば必ずしもベストではないノードを選んでください)。このようにすると、MINが別のノードを選択して以来、そのノードを無駄に伝播するMAXの作業全体が無駄になります。 私が参照しているステップについて: https://jeffbradberry.com/posts/2015/09/intro-to-monte-carlo-tree-search/ ツリーポリシー:https://jeffbradberry.com/images/mcts_selection.png の種類は、彼らがシングルプレイヤーの観点からそれを実行していると信じさせます。モンテカルロツリー検索:2人のプレーヤーのゲームのツリーポリシー
答えて
MCTSの場合、可能な移動の確率分布の妥当な推定値を生成する方法が必要です。 AlphaGo [1]の場合、これは速い展開確率であり、状態をとり、すべての可能な移動にわたって大まかな確率分布を出力する、紙の中の$ p_ \ pi $である。 AlphaGoチームは、これを熟練したゲームで最初に訓練された浅いニューラルネットとして実装し、それから自分自身と対戦することで改善しました。
[1] http://www.nature.com/nature/journal/v529/n7587/full/nature16961.html
それは、MINが別の動きをしたり、私の好みのゲームプレイ方向に動いたときに、私は再びMCTSをやっているので、ゲームプレイに影響しないということですか? –
明らかに、相手のことを完全に知らなくても、MINのすべての動きを完全に予測することは不可能であるため、最良の候補のいくつかを推測し、どこに誘導するかを見ます。プレーンミニマックスの代わりにexpectimaxアルゴリズムを見ると、ここで直感に少し役立つかもしれません – user3080953
- 1. モンテカルロツリー検索や確率的なカードゲームのための他のアルゴリズム?
- 2. 2人のプレーヤーのゲームで州の空間ツリーを形成する方法
- 3. Conwayの人生リスト索引エラーのゲーム
- 4. ロックペーパーはさみ2人のプレーヤー
- 5. ゲーム中のプレーヤーの攻撃性を検出する方法は?
- 6. Python - ブラックジャックのゲームが1人以上のプレーヤーを獲得していない
- 7. 個人用ナレッジベースファイルの索引検索ツール
- 8. カメラに2人以上のプレーヤーを残す
- 9. Mediaelement.jsに2人のプレーヤーが表示されています
- 10. 2人のプレーヤーでデッキを分割する
- 11. 友人リストのphp + facebookグラフ検索
- 12. Solr人名検索の発音アルゴリズム
- 13. 人生のゲーム(コンウェイのゲーム) - セルの隣人をチェックする方法
- 14. 角度2 - パイプを使用した非人為的な検索
- 15. 2つの検索テキストパラメータを使用してpostgres検索する方法、検索フィルタテキスト1 &&検索フィルタテキスト2
- 16. Facebook API - 企業名で検索した人々を検索
- 17. 検索バーイオン2つの
- 18. 角度2のカスタム検索
- 19. のKinect SDKプレーヤー検出
- 20. Google Playゲーム:さまざまなプレーヤーID
- 21. 2人の他人
- 22. Gamekit gkpeerpickercontrollerを使用してさらに2人のプレーヤーを選ぶ
- 23. 角度2の動画プレーヤー
- 24. java:敵のプレーヤーがAIのJavaゲームを追跡する
- 25. Facebook PHP api。人を検索する
- 26. 隠されたゲーム「アタリブレイクアウト」のチートGoogle画像検索
- 27. 2つのイメージ間のイメージサブセットの検索
- 28. Mysqlの検索クエリの2つの列
- 29. MYSQL - 1つの検索用語で2列を検索
- 30. 弾性検索:2種類の距離検索
Iは、問題の任意のPythonが表示されないMです。 –
エクスプロイトプレイには、相手モデリングが必要です。ほとんどのゲームでは、相手プレイが最適にプレーしていると仮定すれば十分です。ポーカーは例外かもしれません。 –
申し訳ありませんピーターのタグ!私はSEに慣れていませんし、ほとんどがPythonでコーディングしています。今私はそれが無関係だったことを実感します。 –