木のグラフにおける相関(2)鎖状のグラフと相関の関係

  • 鎖状のグラフとは、枝分かれのない木グラフのこと
  • ノードは1次元座標で表すこともできて、隣接するノードの位置座標の差をノード間距離と言う
  • このようなノード数Nのグラフがあったとき、それぞれのノードの値を表す長さNのベクトルVを考える
  • Vの値がノードの並び順に照らして、順序をなしているとき、木の位置座標とノードの値にはよい相関があると言い、Vの値がノードの並び順に照らして、順序を守っていないとき、木の位置座標とノードの値にはよい相関がないと言う
  • ノードの「位置座標」のベクトルをX、ノードの値ベクトルをYとすれば

N<-10
X<-sort(runif(N))
Y<-sort(runif(N))
plot(X,Y,type="l")
  • ここで、相関のよさは、\sum_{i=1}^{N-1} d(V_i,V_{i+1})(隣接するノードの値Yの差の総和)が最小であることにも表れている
  • この量が最小であることは、Xの値に意味を持たせても、持たせずに、ノードの位置については、順序だけを考えても(ノン・パラメトリックな枠組み)同様である
  • ここで、X,Yの2軸について、マンハッタン距離を考えることにすれば、Xの値を考慮しても考慮しなくても、関係はなくなり、このグラフの辺のマンハッタン距離の和が小さいこと(max(X)-min(X)+max(Y)-min(Y)が最小値)が「相関のよさ」に対応していることになる
  • ちなみに、ノードの位置を変えずにYの値について、1ペアで交換すると、そのペアの値に関する|Y_i-Y_j|\times 2の分だけ、マンハッタン距離が長くなるという関係にある
  • こちらへ続く