Thirteenth floor

UNOの研究報告 第2回目

2020年8月8日11:08, ボードゲーム

概要

UNOの研究報告 第2回目です!

前回は手札にあるカードをランダムに出すモデルについて考察しました。今回からはある程度カードを出すための指標を設けたモデルを使用します。

使用するモデルは手札にある出せるカードのうち、点数の低いカードから出すモデルです!

モデルの説明

本モデルは基本的なプレイヤーモデルの1つになります。

「手札にあるカードをランダムに出すモデル」を改良(良くなるかはわからないけれど)して、点数の低いカードから出すようにしました。

思考フローは以下の通りです。

  1. 前のプレイヤーがドロー 2 、ドロー 4 、スキップを出してないことを確認する。
  2. 場に出ている 1 番上のカードを確認し、自分の手札に出せるカードを挙げる。
  3. 出せるカードのうち点数の最も低いカードを選択して場に出す(点数が同じ カードがあった場合はランダムに出す、またワイルドのカードにおける色選 択はランダムに行う)。
  4. 出せるカードがない場合、山札からカードを 1 枚取る。
  5. 手番を次のプレイヤーへ移す。

シミュレーションの結果

本モデルをpythonによって実装し、10000回シミュレーションした結果を以下に示します。

UNO_experiment_lowpushmodel

手札にある出せるカードのうち、点数の低いカードから出すモデルのシ ミュレーション結果。横軸が UNO 終了時に取得している得点、縦軸がその得点で 終了したゲーム回数である。 A のみ本モデルを使用し、 B 、 C 、 D は手札にある出 せるカードをランダムに出すモデルをしようしている。また A 、 B 、 C 、 D の順に カードを出す。図から 500 点以上獲得している回数が最も多いのは A である。ま た、回数は 1400 回付近にあり、手札にある出せるカードをランダムに出すモデル の A と比べて 200 回程度増加している。

考察

図は手札にある出せるカードのうち、点数の低いカードから出すモデルのシミュレーション結果です。

500 にプロットされている点を見ると、 A (本モデルを使用したプレイヤー)とB 、さらに B と C 、 D の点がそれぞれ顕著に離れています。

A が 500 にプロットされている点でもっとも多いゲーム回数になっている要因は、前回説明した 1 番目にプレイすることが有利に働いたこと、及び本モデルの思考フローにあると考えられます。 これは今回の A の結果と手札にある出せるカードをランダムに出すモデルの Aの結果を比較した時、今回のほうが 500 点以上を取ったゲーム回数が多いためです。 1 番目にプレイすることの優位性に加えて、点数の低いカードから出すという行動がこの結果につながりました。

点数の低いカードから出すという行動における特徴を考えてみましょう。

  • 序盤には数字のカード、中盤から終盤にかけて記号、ワイルドのカードを出す。
  • 最後に出すカードが記号、ワイルドのカードの確率が高くなる。
  • 終盤における手札の合計得点が高い傾向にある。

中盤から終盤にかけて記号、ワイルドのカードを出すということは、長所だと言えます。 記号、ワイルドのカードは基本的に相手を妨害するカードです。 スキップ、リバース、ドロー 2 、ドロー 4 はどれも次のプレイヤーへ手番を回しません。 特にドロー 2 、ドロー 4 は相手の手札を増やすことができます。 終盤にこれを行うことで、自分が上がったときの相手が持つ手札の合計得点が増加し、自分が獲得する得点が増えます。

また、最後に出すカードがワイルドのカードになりやすいというのも長所です。 ワイルドのカードを持った状態で UNO と宣言すれば、自分に手番が回りさえすれば上がることが出来ます。 数字や記号では、色やカードの値によって上がれない場合もあります。

一方で、終盤における手札の合計得点が高くなるというのは短所だと考えられます。 例えば、ワイルドのカードで UNO と宣言した状態で、他の誰かに上がられてしまえば、上がったプレイヤーは 50 点を獲得できます。 数字のカードで UNO と宣言していれば最高でも 9 点しか相手に与えないのだから、ワイルドのカードで上がろうとするのはリスクがあります。

結果として、このモデルは勝ったときにはより大きな点数を獲得できる反面、負けたときに勝ったプレイヤーへより大きな点数を与えることになります。

次に、本モデルを使用した実験結果のうち、 B と C 、 D の 500 点以上を取ったゲーム回数の差について考えてみましょう。

結果を見れば明らかに B のほうが 500 点以上を取ったゲーム回数が多いです。 手札にある出せるカードをランダムに出すモデルでは、 1 番目のプレイヤーは顕著に飛び出ていましたが、 2 番目以降のプレイヤーについては差がほとんどありませんでした。

本モデルを使用した実験結果で B と C 、 D の間に顕著な差が生まれているのは、本モデルが原因だと想定されます。 B と C 、 D の間にある差は、 A の次かそうでないかという点だと考えられます。 A は本モデルを使用しています。 本モデルの次のプレイヤーは何らかの有利さを受けていると言えます。

本モデルの特徴から次のプレイヤーが受ける有利さは以下のようなものになります。

  • 手札に出せるカードのうち、点数の低いカードから出すため、序盤で記号やワイルドのカードによる妨害を受けにくい。
  • 自分の前のプレイヤー(点数の低いカードから出すモデル)は終盤まで得点の高いカードを持っているため、上がったときに獲得できる点数が高くなります。

重要なのは、序盤に受ける有利さです。

厄介なスキップ、ドロー 2 、ドロー 4 を受けにくくなるため、自分の番が飛ばされることが減ります。 自分はスキップ等の妨害カードを出すことができ、次のプレイヤーの手番を潰すことができます。

結果、手札が他のプレイヤーに比べて早く減り、上がる確率が上がります。 また、点数の低いカードから出すモデルは最後まで高い得点のカードを持っているため、上がったときに獲得できる点数が高くなります。

コメント

コメント投稿ページへ