パターンのありなしとは

  • てんでんばらばらな分布をポアッソン分布とする
  • ポアッソン分布には、1次元分布もあれば、多次元分布もある
  • ポアッソン過程に関してはこちらを参照
  • 分布のうち、2次元を考えてみる。てんでばらばら
plot(runif(1000),runif(1000))

  • これは2次元正規分布。これは、横軸と縦軸は、それぞれ、「ばらばらではない」が、横軸と縦軸との「関係がばらばら」
plot(rnorm(100),rnorm(100))

  • 縦軸と横軸の「ばらばらでない」状態がさらに込み入ってくるけれど、横軸と縦軸との関係はばらばら
plot(c(rnorm(500),rnorm(500,mean=10),rnorm(1000,mean=15)),c(rnorm(1000),rnorm(500,mean=10),rnorm(500,mean=15))[sample(1:2000)])

  • 円周上の分布
Npt<-1000
x<-y<-rep(0,Npt)
r<-1
for(i in 1:Npt){
	t<-runif(1)*2*pi/1
	#r2<-r*(sin(t*200)+100)+rnorm(1)*0.1
	r2<-r*(sin(t*200)+100)+rnorm(1)*1
	x[i]<-r2*cos(t)
	y[i]<-r2*sin(t)
}

plot(x,y)

  • 縦軸も横軸もそれなりの分布・偏りがあり、縦軸と横軸との関係が何かしらある
 library(MASS)
 data(geyser)
 x<-geyser[[1]]
 y<-geyser[[2]]
 plot(x,y)

  • 2軸の関係があるかどうかは、『縦軸』と『横軸』の値の分布は「さておき」〜「与えられたものとして受け入れ」〜そのうえで、『縦軸と横軸の間に関係があるかどうか』を考えること
    • 単純な1次線形のような関係も「関係の一つ」である
    • 上掲の図の一つで小集簇が散在しているようなのは「だまだま」な関係
    • 2次元空間にクラスタリングしている(最後の例)も「関係がある」し
    • 円周に並ぶのも「関係」
  • さて「関係がある」というのは、空間に「パターンが見える」ということであるが、「パターンが見える」というのは、どういうことなのか、と考える