射影多様体と尤度関数のためのメモ

  • こちらで尤度関数を(代数で)解くという記事を書いた
    • まあまあ、わかって書いた部分と、わからないままに書いた部分と、誤解して(その誤解にまだ気付いていない)書いた部分とが混ざっている
    • それなりの長さに収めないとメモとしての意味がないので、端折ってしまった事項などがあり、そうは言っても重要な事項なので、用語だけを使っても意味がないので、そんな重要な用語(らしきもの)について、少し整理をする
  • 参考資料1
  • 参考資料2
  • 射影空間
    • 定義の仕方は複数あるが、
    • n+1個の変数の組で、自由度nの空間を表す方法の1つ
    • (x_1:x_2:...:x_{n+1}) = (\lambda x_1:\lambda x_2: ... : \lambda x_{n+1})のように\lambda倍すると同じになるような値の組は同一視することで次元がn+1からnに減る
    • (x_1:x_2:...)の":"の記号を使うと「比」が同じなら同一視、という言い枚がよく表れる
    • (x_1=x_2=...=x_{n+1}=0)という点は含まない(区別ができないから)
      • このことから射影空間にはU_i = \{(x_1:x_2:...:x_{n+1}) | x_i \ne 0 \}という部分空間がi=1,2,...,n+1通り作れて、\bigcup_{i=1}^{n+1} U_iが射影空間全体になる
      • この分解は相互にオーバーラップのある分解
      • 相互にオーバーラップのない分解の仕方もある
      • C^n \cup C^{n-1} \cup C^{n-2} \cup ... \cup C^0、ただし、C^{n^i} = \{(x_1:x_2:...:x_{n+1})|x_1=x_2=...=x_i=0,x_{i+1} \ne 0\}
      • この分解の仕方は正単体を点、辺、面、一段階高次の面、…と分解するのに似ている
  • 多項式環
    • 多項式は単項の和
    • 単項を次数で揃える(斉次)すると
    • n+1個の変数が作る多項式環C[x_1,...,x_{n+1}]
    • \bigoplus_{d=0}^{\infty} C[x_1,...,x_{n+1}]_dのように次数dに関して分解できる。ただしC[x_1,...,x_{n+1}]_dはd次の斉次多項式(環・集合)
    • 多項式環を斉次に分解するのは、射影多様体において斉次多項式にある特徴があるから(次に述べる)
  • 斉次多項式と射影多様体
    • d次の斉次多項式Fに関してF(\lambda x_1,...,\lambda x_{n+1}) = \lambda^d F(x_1,...,x_{n+1})であるので、射影空間で同一の点とみなされる点について、多項式Fは必ずしも同一の値を与えない(から、良くない)
    • が、多項式F(\mathbf{x})=0に関しては別で、射影空間の部分集合として定義できる
  • 斉次化
    • 斉次化はイデアルに関しても良い性質がある
    • イデアルが斉次多項式集合の和に分解できるとき斉次なイデアルであると言い、そのとき射影空間に、イデアルが定める射影超平面は、多数の射影超平面の交叉部分として表現できる(その表現を作るときに斉次なイデアルが多数の斉次なgeneratorsをもつことを使う)
  • 射影空間の多様体の例
    • P^2_R:実数を体として変数が2+1=3個で表現される空間の多様体
    • 多様体は斉次多項式=0(の交叉部分)だ、ということになっていたから、たとえば
      • x^2+y^2-yz=0
      • これをふつうの実数3次元空間(アフィン実数3次元空間)で描けば

z <- seq(from=-5,to=5,length=100)
t <- seq(from=0,to=1,length=100)*2*pi

x <- y <- z2 <- c()
for(i in 1:length(z)){
	x <- c(x,abs(z[i])/2*sin(t))
	y <- c(y,abs(z[i])/2*cos(t)+z[i]/2)
	z2 <- c(z2,rep(z[i],length(t)))
}

mm <- range(c(x,y,z2))
x <- c(x,mm)
y <- c(y,mm)
z2 <-c(z2,mm)
library(rgl)
plot3d(x,y,z2)
      • これを、x=1,y=1,z=1のそれぞれで切って、その切り口を見てみる
        • 1+y^2-yz=0
        • x^2+1-z=0
        • x^2+y^2^-y=0となる

par(mfcol=c(2,2))
y <- seq(from=-5,to=5,length=1000)
z <- 1/y+y
plot(y,z,cex=0.1)
x <- seq(from=-5,to=5,length=1000)
z <- x^2+1
plot(x,z,cex=0.1)
x <- cos(t)/2
y <- sin(t)/2 + 1/2
plot(x,y,cex=0.1)
    • これを、x=1,y=1,z=1のそれぞれで切って、その切り口を見てみる、というのは、n+1個の変数のうち、どれか一つを取り出して、それに対する比の値(のセット)が同じものは同一視する、という射影空間座標の考え方をなぞっている
    • また、このようにx,y,zの3変数の関数を3つのアフィン空間の和に分解するのは(張り合わせとして考えるのは)、射影多様体の定義そのもの
  • Segre variety
    • P^n \times P^m \to P^{(n+1)(m+1)-1}
    • いかにも分割表的な雰囲気なので、Segre variety x contingency tableと検索すると…
      • 資料1
      • 資料2
      • そして、それはいかにも昔作ったポスターの話(こちら)と似ているのだった…
    • Segre varietyとは独立性モデル
    • 分割表で言えばlog-linear model(的な)
    • Segre variety はdeterminant variety の一種
    • Determinant variety は計算しやすいalgebraic variety
    • 2次形式多項式で定まっている