Hatena::ブログ(Diary)

AT-WORLD このページをアンテナに追加 RSSフィード

Pippin(ぴぴん)のUltimaOnline諸々の日記です。
一時的に復活中。

2008-08-24

[][][]人狼ロジックメモ

以前考えたことについての備忘録

(というより、うおみんからの転載)

m番目の村人の視点で、n番目の選択肢を選んだときの村の利得をG_{nm}

m番目の村人の視点で、k番目の配役予想の確率p_{km}

n番目の選択肢を選んだときの、k番目の配役予想での村側の利得を g_{nk}とすると、

 G_{nm}=g_{nk} p_{km}

ただし、¥forall m , ¥sum_k p_{km}=1とする。(確率の規格化)




なお、各村人視点に対しては次式が成立する。(m=1のとき)

 ¥vec{G_n}=g_{nk} ¥vec{p_k}

ベクトル¥vec{G_n}および¥vec{p_k}はそれぞれ縦ベクトルである。



A,B,C,D,Eの5人でゲームをしたとき。

配役バランスは、狼1,狂1,祈0,牧1,村2である。(配役公開)

期限は5日目朝までとしている。

自分はEで牧師である。(視点限定: テンソルの階数を減らし、説明を簡単にするため)

また、部屋割りは2人部屋から作り、独房ありとする。

1日目部屋割り

A→B(AがBを指名)

C→D

E(独房)

2日目朝

B,Dが死亡

A,Cはそれぞれ、「自殺された」と主張している。


このとき、A,Cのどちらかが狼であり、どちらかが村人である。

その確率はほぼ半々であると言える。

このときのリンチ時の選択の利得を考える。

村が完全に勝利する場合、利得を1、

狼が完全に勝利する場合、利得を-1となるようにする。


まず、配役の可能性は全部で以下の2つだけである。

  1. A狼、C村、E牧師(確率p_1=¥frac{1}{2})
  2. A村、C狼、E牧師(確率p_2=¥frac{1}{2})

よって、確率ベクトル¥vec{p}は次のように書ける。

 ¥vec{p_k}=¥left( ¥begin{array} ¥frac{1}{2} ¥¥ ¥frac{1}{2} ¥end{array} ¥right)


次に、利得を計算する。

村側の選択肢は全部で4つ。


これらの選択肢を選んだときの利得について考える。

Aリンチ(選択肢1)

Aをリンチしたとき、村人は勝てるだろうか。

Aが狼だったら勝てる、Cが狼だったら負けるということになる。

つまり、g_{11}=1,g_{12}=-1となる。

Cリンチ(選択肢2)

Cをリンチしたとき、村人は勝てるだろうか。

Cが狼だったら勝てる、Aが狼だったら負けるということになる。

つまり、g_{21}=-1,g_{22}=1となる。

Eリンチ(選択肢3)

Eをリンチしたら、A,Cどちらが狼であっても、村側が負ける。

つまり、g_{31}=-1,g_{32}=-1となる。

割り(選択肢4)

投票順がEが最後となってしまった場合有効となるが、他の投票順の時は選べないかも?

2日目夜に狼が牧師Eを噛んだとき勝つことが出来る。

その確率はほぼ半々とする。(半々とする: 厳密にはやや村側有利と考えられるが、ここでは割愛致します。)

とすると、A、Cどちらが狼であっても、リンチ後の時点ではイーブンと思われる。

つまり、g_{41}=0,g_{42}=0となる。


以上により、利得行列は次のようになる。

g_{nk}=¥left( ¥begin{array} 1 && -1 ¥¥ -1 && 1 ¥¥ -1 && -1 ¥¥ 0 && 0 ¥end{array} ¥right)


すると、リンチ後の利得は以下のように書ける。

 ¥begin{eqnarray} ¥vec{G_n} &=& ¥left( ¥begin{array} 1 && -1 ¥¥ -1 && 1 ¥¥ -1 && -1 ¥¥ 0 && 0 ¥end{array} ¥right) ¥left( ¥begin{array} ¥frac{1}{2} ¥¥ ¥frac{1}{2} ¥end{array} ¥right) ¥¥ &=& ¥left( ¥begin{array} 0 ¥¥ 0 ¥¥ -1 ¥¥0 ¥end{array} ¥right) ¥end{eqnarray}


従って、

選択肢に対する利得は次のように計算できた。

よって、Eリンチでは確実に村が負けるが、それ以外の選択肢はイーブンである。

(配役確率(推理)が変われば、当然利得も変化する。)



以上。

長いメモ

[][][]人狼ロジックメモ2

人狼ロジックメモ - AT-WORLDからの続き。

利得行列g_{nk}未来確率確率ベクトル(行列)¥vec{p_k}({p_{km}})は過去確率ということもできる。

また、利得行列g_{nk}未来情報を全て内包する必要があるため、その要素も上記と同様な形式で書くことが出来る。


従って、ゲーム開始からゲーム終了までにi回の選択肢があるとすると、そのゲームはi階のテンソルで書くことが出来るはずである。



0100 | 00 |
1006 | 07 |
2005 | 10 | 11 | 12 |
2006 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 |
2007 | 03 | 05 | 08 | 09 | 10 | 11 | 12 |
2008 | 01 | 03 | 04 | 07 | 08 |
2010 | 10 | 11 |

"(C) Electronic Arts Inc. Electronic Arts, EA, EA GAMES, the EA GAMES logo, Ultima, the UO logo and Britannia are trademarks or registered trademarks of Electronic Arts Inc. in the U.S. and/or other countries. All rights reserved."