2011-02-17

２つの行列が決める

行列

こちらから
- ９つのグラフがある
- 離散的な値(得点)の確率密度分布である
- この９つの確率密度分布は、(大まかに言えば)９人の並べ方に対応して求めたものである
- ９人は２種類に分けられて、その種類別人数は１人と８人である
  - ABB BBB BBBの並べ方が９通りなので、９つの確率密度分布ができている
  - 打者９人の打率をすべて別々にすると、ここの並べ方が $9!$ になるので、網羅的調査は不適当になる
この確率密度分布の間の関係を考えよう
- ９人は、その並び方に応じて、順番にある行為をする(打席に立つ)
- ９人の行為は確率的である
- イニングと呼ばれる行為のセットがあり、それには終了基準があり、確率的行為によって決まる
- 終了基準を満たしたら、そのイニングでの得点が決まる
- 終了基準を満たしたら、次のイニングでの行為を始める人が決まる
９人の並び方をとする
- $s_1=(b_1,b_2,...,b_9)$
- $s_2=(b_2,b_3,...,b_9,b_1)$
- ...
- $s_9=(b_9,b_1,b_2,...,b_8$
- 並び方 $s_i$ の場合に、その第 $j$ 番目から始まるイニングは、 $s_{(i+j\%\%9)}$ ( $\%\%$ は剰余計算)の１番目から始まると同じ
さて、あるイニングがの１番目から始まったとする
- 次のイニングがのうちのどの並び方の１番目から始まるかは確率的に決まる
  - その確率を $P(j|i)$ と書こう
- このイニングで取る得点はである。何点を取るかは確率的に決まる
  - その確率を $Q(t|i)$ と書こう
今、あるイニングがの第１番目から始まる確率が、であったとする
- 次のイニングが $s_j$ の第１番目から始まる確率は、 $\sum_{i=1}^9 v_i \times P(j|i)$ で算出される
- このことは次のイニングの開始バッターの確率ベクトル $v(x+1)$ は $v(x+1)=P v(x):P=(P(j|i)$ という $P(j|i)$ を要素とする行列で表されることを意味する
今、で試合開始をする場合には、
- 第１イニングの先頭打者の確率分布は $v_1(1)=(1,0,0,0,0,0,0,0,0)$ で
- 第２イニング以降は $v_1(2)=P v_1(1),v_1(3)=P^2 v_1(1),...,v_1(9)=P^8 v_1(1)$ である
同様に、で試合開始をする場合には、
- 第１イニングの先頭打者の確率分布は $v_w(1)$ i番目が１で残りが0で
- 第２イニング以降は $v_w(2)=P v_w(1),v_w(3)=P^2 v_w(1),...,v_w(9)=P^8 v_w(1)$ である
これを足し合わせた $v_w(1)+v_w(2)+...+v_w(9)=\sum_{a=0}^8 P^a v_w(1)=V_w$ が、先頭打者がだれであるかについて、９イニングの通算ベクトル( $V_w=(V_{w,1},V_{w,2},...,V_{w,9})$ の要素の和は９)である
得点の方を考えよう
- $s_i$ の先頭打者から始まったときの得点の確率は $Q(t|i)$ として与えたから、先頭打者の確率ベクトルが $v=(v_1,v_2,...,v_9)$ のときに、そのイニングに $t$ 点とる確率は $\sum_{i=1}^9 v_i \times Q(t|i)$
- したがって、このイニングの得点の期待値は $\sum_{t=0}^{\infty} t \times :(\sum_{i=1}^9 v_i \times Q(t|i))$
- 先に出した $V_w$ を使えば、１試合の得点の期待値は $\sum_{t=0}^{\infty} t \times :(\sum_{i=1}^9 V_{w,i} \times Q(t|i))$
変数がたくさん出てきてごちゃごちゃしたけれど、必要なのは次の通り
- $P$ : $9\times 9$ 行列(推移行列)
- $Q$ : $0,1,2,...,\infty$ に対応した $\infty \times 9$ 行列
- $P,Q$ をランダムに作って計算しよう
打者の打率パターンと打者の並べ方が、PとQとを決める
PとQとは相互に関係のある行列
PとQとが決まれば、後は、イニング数が試合の総得点を決める

# P,Qを適当に作る
library(MCMCpack)
nbatter<-9
P<-rdirichlet(nbatter,rep(1,nbatter))
# 低得点の確率を高くする
Tmax<-20
t<-0:Tmax
Q<-t(rdirichlet(nbatter,2^(-t)*10))
# 検算
apply(P,1,sum)
apply(Q,2,sum) # Tmaxは十分なことの確認
matplot(Q,type="l")
# 打順ごとの、初回先頭打者確率ベクトルは
v.1<-diag(rep(1,nbatter))
# 第iイニングのそれは P^(i-1) v.1
v<-NULL
library(expm)
# イニング数をだんだんに増やして得点分布がどう変わるか見よう
# イニング数が少ないと、「ばくち」の要素があるが、イニング数が増えると、「分布が収束(PとQとによって定められた分布へと収束)」するらしいことがわかる
Nininngs<-1:9
par(mfcol=c(3,3))
for(x in 1:length(Nininngs)){
	nininng<-Nininngs[x]
for(i in 1:nininng){
	v[[i]]<-P%^%(i-1) %*%v.1 # %^%は行列のべき乗
}
# Vはvの足し合わせ
V<-matrix(0,nbatter,nbatter)
for(i in 1:nininng){
	V<-V+v[[i]]
}

# 得点分布
Point<-Q %*% V

matplot(Point,type="l",main=x)

}