木のグラフにおける相関(2)鎖状のグラフと相関の関係
- 鎖状のグラフとは、枝分かれのない木グラフのこと
- ノードは1次元座標で表すこともできて、隣接するノードの位置座標の差をノード間距離と言う
- このようなノード数Nのグラフがあったとき、それぞれのノードの値を表す長さNのベクトルVを考える
- Vの値がノードの並び順に照らして、順序をなしているとき、木の位置座標とノードの値にはよい相関があると言い、Vの値がノードの並び順に照らして、順序を守っていないとき、木の位置座標とノードの値にはよい相関がないと言う
- ノードの「位置座標」のベクトルをX、ノードの値ベクトルをYとすれば
N<-10 X<-sort(runif(N)) Y<-sort(runif(N)) plot(X,Y,type="l")
- ここで、相関のよさは、(隣接するノードの値Yの差の総和)が最小であることにも表れている
- この量が最小であることは、Xの値に意味を持たせても、持たせずに、ノードの位置については、順序だけを考えても(ノン・パラメトリックな枠組み)同様である
- ここで、X,Yの2軸について、マンハッタン距離を考えることにすれば、Xの値を考慮しても考慮しなくても、関係はなくなり、このグラフの辺のマンハッタン距離の和が小さいこと(が最小値)が「相関のよさ」に対応していることになる
- ちなみに、ノードの位置を変えずにYの値について、1ペアで交換すると、そのペアの値に関するの分だけ、マンハッタン距離が長くなるという関係にある
- こちらへ続く