Thirteenth floor

UNOの研究報告 第3回目

2020年9月16日10:24, ボードゲーム

概要

UNOの研究報告第3回目です。

前回は点数の低いカードから出すモデルについて考察を行いました。今回はその反対、点数の高いカードから出すモデルについて考察を行っていきます。

モデルの説明

本モデルは基本プレイヤーモデルの1つです。

手札にある出せるカードをランダムに出すモデル」を改良し、点数の高いカードから出すようにしました。

思考フローは以下の通りです。

  1. 前のプレイヤーがドロー 2 、ドロー 4 、スキップを出していないことを確認 する。
  2. 場に出ている 1 番上のカードを確認し、自分の手札にある出せるカードを挙 げる。
  3. 出せるカードのうち点数の最も高いカードを選択して場に出す(点数が同じ カードがあった場合はランダムに出す、またワイルドのカードにおける色選 択はランダムに行う)。
  4. 出せるカードがない場合、山札からカードを 1 枚取る。
  5. 手番を次のプレイヤーへ移す。

シミュレーションの結果

本モデルをpythonによって実装し、10000回シミュレーションした結果を以下に示します。

点数の高いカードから出すモデルのシミュレーション結果

手札にある出せるカードのうち、点数の高いカードから出すモデルのシミュレーション結果。 横軸がUNO終了時に取得している得点、縦軸がその得点で終了したゲーム回数である。 Aのみ本モデルを使用し、B、C、Dは手札にある出せるカードをランダムに出すモデルを使用している。 またA、B、C、Dの順にカードを出す。 図の500にプロットされている点を見ると、A、B、Cの間にはほとんど差がなく、 Bだけ顕著にゲーム回数が少なくなっていることがわかる。

考察

は手札にある出せるカードのうち点数の高いカードから出すモデルのシミュレーション結果です。500にプロットされている点を確認すると、A、C、Dには大きな差がありません。Bのみ顕著にゲーム回数が少なくなっています。

前回までの考察で、1番最初にプレイするAは1番目にプレイすることの有利さを受け取っていました。今回の結果を見ると、横軸500において、AはC、Dとほとんど同じゲーム回数になっています。

Aが500におけるゲーム回数でC、Dを引き離すことが出来なかった原因には、本モデルの思考フローである点数の高いカードから出すということが関連していると考えられます。

ここで、本モデルの特徴を整理してみましょう。

  • 序盤にはワイルド、記号のカード、中盤から終盤にかけて数字のカードを出す。
  • 最後に出すカードが数字のカードになる確率が高くなる。
  • 終盤における手札の合計得点が低い傾向にある。

序盤、中盤、終盤で出されるカードが持つ傾向

序盤にワイルドや記号のカードを出すという特徴は、の横軸500におけるBのゲーム回数が他のプレイヤーに比べて減少していることへ現れています。 Aが序盤からスキップやリバース、ドロー2、ドロー4といった相手の行動を妨害するカードを出すため、Bは序盤動きにくくなります。 結果、Bは他の3人に比べて500におけるゲーム回数が減少したと考えられます。

最後に出すカード

本モデルを使用すると、序盤から中盤にかけてワイルドのカードや記号のカードを出します。終盤に残っているのは、ほとんどの場合数字のカードになると想定されます。

最後に残るカードが数字のカードである場合、上がる(最後の1枚を出すこと)が難しくなります。このことは最後に残ったカードがワイルドのカードである場合と比較すると分かりやすいです。

ワイルドのカードは、場の1番上にあるカードがどのような種類のカードでも、必ず出せます。一方で、数字のカードは、場の1番上のカードが「同じ数字を持っている」または「同じ色を持っている」場合のみ出せます。

終盤に持っている手札の合計得点

上記2つの特徴からも言えますが、終盤に持っているカードは数字のカードになります。数字のカードはワイルドのカードや記号のカードに比べて点数が低いです。

これは自分以外の誰かが上がった場合でも、相手に与える得点が少なくて済むということです。2番目に挙げた特徴で本モデルは上がりにくいと述べましたが、それと引き換えにこの特徴があります。

C、Dの500における得点

次にC、Dの500における得点がAとほとんど変わらない点について考えてみましょう。

CについてはBの得点が減少していることからもわかるように、Bからの妨害が減ったためだと考えられます。BはAからの妨害を受けて、序盤は自由に行動することができません。Bが自由に行動できないため、CはBから受けるはずだった妨害を受けることなくゲームを進行できます。当然ですが、妨害される回数が減れば自分の手札枚数が少なくなる速度は大きくなります。結果として勝利する回数につながっていきます。

Dは500におけるゲーム回数がCとほとんど同じです。この結果自体は「手札にある出せるカードをランダムに出すモデル」や「点数の低いカードから出すモデル」でも見られました。これはDが「手札にある出せるカードをランダムに出すモデル」を使用しているためだと考えられます。

手札にある出せるカードをランダムに出すモデルはお互いにあらゆる影響を与えていません。少なくとも、「点数の低いカードから出すモデル」や本モデルのような明確な影響を与えていません。そのため統計的な結果(10000回シミュレーション)としてみればほとんど同じゲーム回数になると思われます。

コメント

コメント投稿ページへ