分割表

  • 2x2の分割表を考える
  • 2群の標本数が等しい分割表を考える
  • 1群の標本数を1,2,..,i,.,nと増やす
  • このとき、取りうるすべての分割表のパターン数は1群の標本数がiのとき、(i+1)^2
    • 1つ目の群が(0,i),(1,i-1),...,(i,0)となってi+1通り、もうひとつの群も同様にi+1通り
  • 今、i=1からnまで順番に増やしていくとする
  • iがi+1になるときには、iのときに
((a,i-a),(b,i-b))

という表に各群、1名ずつ増えると、

((a+1,i-a),(b+1,i-b)),((a+1,i-a),(b,i-b+1)),((a,i-a+1),(b+1,i-b)),((a,i-a+1),(b,i-b+1))

の4つになりうる

  • この人数を増やす過程での、表の推移の可能性をグラフにすると、i=0のときに表は1種類、i=1のときに、この1つから4つの表に推移する。次にi=2に増えると、全部で9種類の表が作られうるが、元の4つの表のそれぞれからは、4つの推移エッジしか生えていない
  • ここで、1つ目の群で、第一カテゴリの生起確率がp1、2つ目の群で、第一カテゴリの生起確率がp2であるとすると、この4つの推移エッジは、それぞれ、p1p2,p1(1-p2),(1-p1)p2,(1-p1)(1-p2)の推移確率を持っている
  • そんな風にすると、2群の比較をしながら、標本数を2つずつ各群均等に増やしていくときの表のパターンの追跡ができる
  • この話は、実は、無情報(2x2表のセルがすべて0の場合)から、ちょっとずつ情報が増えていくときの「決断」に関する調べ物をするための道具作り
  • 実際には、1x1の行列から初めることとし、ixi行列から(i+1)x(i+1)行列を作るときに、ixi行列のコピーを4つ作り、それらに4つの推移ベクトルの確率で重みをつけ、(i+1)x(i+1)の行列の部分行列(1:i,1:i),(1:i,2:(i+1)),(2:(i+1),1:i),(2:(i+1),2:(i+1))にその4つを足し合わせていくことで出来上がる
ps <- c(0.3,0.4)

n <- 5

X <- list()
X[[1]] <- matrix(1,1,1)

for(i in 2:n){
	X[[i]] <- matrix(0,i,i)
	X[[i]][1:(i-1),1:(i-1)] <- X[[i-1]]*ps[1]*ps[2]
	X[[i]][1:(i-1),2:i] <- X[[i-1]]*ps[1]*(1-ps[2])
	X[[i]][2:i,1:(i-1)] <- X[[i-1]]*(1-ps[1])*ps[2]
	X[[i]][2:i,2:i] <- X[[i-1]]*(1-ps[1])*(1-ps[2])
}