ぱらぱらめくる『全ての概念はKan拡張である』
- こちらのサイトの内容が本になったそうだ
- この本に進む前に、別のPDF資料(哲学者のための圏論入門 森田真生(独立研究者))で、そもそも圏論とはどういう枠組み化を確認しておく
- 対象と関係とで考える仕組み
- 集合では対象が集合であって、集合には要素があって、その要素ごとに考えるのに対して
- 圏論では対象の中身には立ち入らずに、対象を塊として考えることに特徴がある
- 集合での考え方をinternalな視点、圏論での考え方をexternalな視点と言うことができる
- exeternalに考えて(要素を扱わずして)、(集合を伴う場合には)集合の写像で必要な単射・全射・全単射が定義できるということは、圏論のexternalな視点を理解する上の鍵になる
- また、集合を集合たらしめる「要素」が不要になるので、集合ではないものも対象にできるのが圏論
- 集合ではないものを対象にして圏を定め、圏と圏との関係を見ることで、集合とは限らない多彩な数学対象を扱うことができて、かつ、数学対象同士の対応を扱うことができる
- このようなアプローチの背景には、様々な数学対象を代数化して、同型判定しやすい数学対象で議論し不変量を取り出すという考え方があるだろう(参考:こちらも)
- 圏論は集合と立場を違える、という最初の説明とは逆説的になるが、集合自体も特別な性質を持った圏として定義できる
- 代数における二項演算では、演算が要素集合で閉じているので、代数構造も圏対象から同じ圏対象への射を持つという形で捉えることができる
- 圏と圏との関係自体を圏と捉えることも可能で、階層化できる
- 圏論とは何か
- 「群として同型ならば、集合として同型である」したがって、「2つの群をそれぞれ集合に対応付けて、集合同士が同型であるかを調べ、集合同士が同型でないことが示せたならば、元の群同士は同型ではない」と言えることになる
- このように考えるときに、群の圏と集合の圏と、群の圏から集合の圏への関手とを考えるのが圏論
- 同様に「位相空間同士が同型ならば、位相空間に紐づく基本群は同型である」を使って、「(取り扱いがより容易な)基本群同士の同型を調べ、それが同型でないことが示せたならば、元の位相空間同士は同型ではない」と言える
- この際、位相空間の圏と基本群の圏と、位相空間の圏から基本群の圏への関手を考える
- 構成する概念と記法
- 用語としてはcategory in nLabに基づくのが良さそう
- 1つの圏 (a category)は、二つの集まり collections の組からなる。二つの集まりは「対象の集まり」と「射の集まり」である
- このことをと書くことにする
- 対象 object(s)と射 morphism(s)/arrow(s)との関係
- 射は合成できる。この合成は射に定められた二項演算である。合成される射と合成できる射とには満足すべきドメイン対象とコドメイン対象との関係ルールを定めるのがよく、そうなっている
- 恒等射が存在するようにしておくことで圏論がうまく回る。したがって恒等射の存在をルールとする
- 圏の集まりと関手Functor F
- 二つの圏を関手Fでつなぐ
- 対象は 、射はとなり、となる
- 同型
- 圏の例、圏と関手の例
- 対象=集合、射=集合から集合への写像、射の合成=集合から集合への写像は合成して写像となる、恒等射=恒等写像:集合の圏
- 対象=群、射=群準同型、射の合成=群準同型関係を合成しても相変わらず群準同型関係、恒等射=ある群が自身と群準同型であることに相当:群の圏
- 対象=位相空間、射=連続写像(位相を変えない変形)、射の合成=連続写像を合成すると連続写像、恒等射=動かさない写像:位相空間の圏
- 群の圏と集合の圏とを関手でつなぐことができる。群は集合と二項演算の組であり、集合はその名の通り集合であって二項演算は存在しない。関手で2つの圏をつなぐことはできる。群の圏の群の集合と集合の圏の集合とに全単射を置くことはできるが、集合の圏では演算のことを取り扱うことはできない。このように、情報・構造の一部が失われる形式で結ぶ関手を忘却関手と呼ぶ
- 対象=ある特定の点を指定した位相空間、射=連続写像:基点付き位相空間の圏
- 基点付き位相空間を考えるとき、その基点から出てその基点に戻るループの区別を考えることができる。これを、この位相空間のこの基点における基本群と言うから、基点付き位相空間の圏と、基点付き位相空間に付随する基本群の圏との対応が取れる。この対応を取るのが両圏を結ぶ関手になる
- 集合も圏
- 群も圏、群の演算表に相当するルールが射の集まり全体として存在する。単位元の存在はId射の存在に対応する。元の数だけ射がある
- 順序集合も圏
- 圏の集まりと関手の集まりとを、対象の集まりと射の集まりとみなすとそれも圏
- 圏は図で表すこともできる
- 共変関手と反変関手と反転圏
- 関手は、圏Cから圏Dへの矢印。Cの対象をDの対象に移す。Cの射をDの射に移す。Cの射とDの射とで、射のドメイン対象とコドメイン対象の関係が維持されれば共変関手。射のドメイン対象とコドメイン対象がひっくり返れば反変関手
- 普通の関手は、をとするが、をのような関係も考えられる。対象を結ぶ射の向きが関手によって逆になっている。このような関手を反変関手という
- ある圏Cでのに対して、対応する「逆の圏=反転圏」を考えてとすると、反変関手によって現れるはを共変関手で移したものとなる
- 圏の構成例
- 全ての概念はKan拡張である
- 「〇〇って、××のことだよね」という比喩は圏論で言うところのKan拡張で表すことができます、ということらしい
- 「CのXって、DのYってことだけど、それって、EのZがやっぱりDのYってことだよね」と言うとき、C,D,Eが圏で、CとD、CとE、DとEに関手関係が生じていて、3つの圏の関係性の定義にあるKan拡張がこの関手関係で定義されている、ということらしい
- Kan拡張の定義には
- 「同じ条件を満たすものがあるならば、自然変換が一意に存在して、ある合成が成立する」という条件が現れる
- これは、圏において普遍性の定義に出てきた言い回しとほぼ同じ
- 言い換えると、Kan拡張は、圏の集まりを対象の集まりとみなしたときに関手の集まりが射の集まりとみなされるが、その関係性の中に認められる一意な自然変換のことだが、それは、圏の集まりを対象とした圏における、普遍性の定め方みたいなものだよね、という意味合いで、(広い意味で)普遍性の一種、ということだ、と言っている(のだろう)
非可換幾何:ペンローズタイリングと非可換トーラス葉層との関係
- こちらの記事などで、ペンローズタイリングが01列を使って表現され、ペンローズタイリングを納めた空間の非可換幾何の話を書いた
- 非可換幾何の題材として、もう一つよく見るのが、非可換トーラスである。非可換トーラスについてはこちらなどに書いた
- 正方形の左右辺と上下辺の貼り合わせでトーラスを作るが、貼り合わせの際に少しずらすと非可換トーラスになるという話
- 以下のjupyter notebookでは、次のことを確認している
- ペンローズタイリングに対応する01列と深い関係があるFibonacci鎖が、ペンローズの2種類のタイルの並べ順に対応し、そのような無限01列の生成方法として、2次元正方格子を斜めにして、正方格子点を結ぶ折線であって、かつ、ほとんど水平な折れ線とはどういうものか、それと01列・Fibonacci鎖とが関係するという話
- 同じくFibonacci鎖を非可換トーラスモデルを使って作るという話(非可換トーラスは、1枚の正方形で作れるが、それを正方形タイルを敷き詰めたものとみることで、非可換トーラス上の直線が二次元平面上の直線になることを利用して、その2次元平面の直線が正方格子の水平線・鉛直線と交わるパターンをFibonacci鎖にする話)
ぱらぱらめくる『量子力学の数学的基礎』
- 難しい本らしい
- 多少なりとも何か自分の足しになればと思って書くことにする
- 1. 序論的考察
- 2. 抽象ヒルベルト空間の一般論
- 有限行列では自明な解(0ベクトル)以外の固有ベクトルを求めることが課題。固有ベクトルはそのノルムが何でもよいので、単位ベクトルの探解とみなしてもよい
- 波動関数で問題になる無限次元の方でも固有値と固有関数が問題となるが、そもそも波動関数が0ではだめで、「確率密度の積分が1」だという制約が入っている。それは行列での固有値問題における単位固有ベクトル探しに相当する
- さらに、ハミルトニアンなどの無限次元行列の形をした作用素は、状態ベクトルでサンドイッチして物理量の期待値を返すので、エルミート、さらに、状態ベクトルの変換としてみるときは、ユニタリ
- したがって、抽象ヒルベルト空間を想定した無限次元行列(を含む、行列)の固有値問題は、エルミート行列やユニタリ行列に関する固有値問題に制約して明らかにすることが必要になる
- したがって、抽象ヒルベルト空間の議論にも、そのような方向での制約化行列とその固有値問題とが主流になる
- 3. 量子力学の統計
- 4. 理論の演繹的構成
- 標本はばらつく。たくさんの標本を観測し、その期待値を求めると、その期待値もばらつく。ばらつきはするが、標本数が大きいとき、その期待値を真の平均との違いは小さくなる(大数の法則)。これが、巨視的物理観測では、量子的ばらつきが影を潜め、同じ(と思われる)状態を繰り返し観測すると、『巨視的な観測誤差』を除けば、ほぼ同じ値が観測される理由(らしい)
冪等性、idempotency、量子力学、純粋状態
- こちらの記事
- で、フォン・ノイマン環と射影行列のことを書いた
- 射影行列ではであって、それが大事な役割を果たす
- でも、どうしてそんなことが気になるのかがわからなかった
- は冪等性 idempotency
- 冪等行列では、固有値が0か1になる
- 量子力学ではたくさんの状態(無限にたくさんの状態のことも…)につき、無限長の複素確率ベクトルを考えるが、ある純粋状態が無限長ベクトルの1か所にあるとすると、それは、「純粋状態」
- そのことと関係するので、冪等行列のことが気になる
- (たぶん)座標の取り方によらず純粋状態を気にするので、冪等性をいじっているうちに出てきたのがフォン・ノイマン代数の複素整数行列で、それらが閉じていないと物理現象として困るということなのだと、ひとまず理解しておく
フォン・ノイマン環と射影行列
- フォン・ノイマン環 Von Neumann algebra - Wikipediaを勉強していると、射影行列というものが出てくる。
- その環の要素の説明に射影行列が出てくる。
- であると言う。
- 射影行列は線形回帰の文脈でも登場する。Projection matrix - Wikipedia
- 最小2乗法により、観測値セットを表す点から、モデル部分空間への垂線の足が推測値セットを表す点になることを言っている。
- WikipediaVon Neumann algebraの記事には、von Neumann algebraとProjectionsとの関連として、"they (projections) are exactly the operators which give an orthogonal projection of H onto some closed subspace."と記載されているように、射影行列は空間を亜空間に直交射影する。
- 行列を考えているから、この射影は線形射影である。
- 空間のすべての点が(線形)部分空間に射影されるから、射影行列を構成するベクトルは線形独立ではなく、固有値の中に0が含まれる~行列式は0である。
- 2x2行列でなる行列がどうなるか考えてみる。
- :は、共役転置のことなので、2x2行列はのように、対角成分は実数、2つの非対角成分は相互に共役複素数となる。
- これを書き換えるととなる。
- という条件から、となる。
- の場合には、となり、(単位行列)となる。
- の場合には、から、が得られる。また、から。
- ただし、のときはとなるが、のときは、(純虚数)になっていることに注意
- したがって、となる。
- 固有値は、1と0になっている。
- 固有値1に対応する固有ベクトルで、かつ、二乗ノルムが1なるベクトルは、を二乗ノルムが1になるように補正したベクトル、固有値0に対応する固有ベクトルはを二乗ノルムが1になるように補正したベクトル
- 0なる固有値があることが、2次元平面を直線につぶすことを意味し、1なる固有値があることが、固有値1に対応する固有ベクトルが表す直線上の点は動かないことを表しており、その直線と交叉し0なる固有値に対応する固有ベクトル方向の直線は、その交点につぶされることを意味する。
- この射影行列が次のように分解されるという話がある。。このとき、ととはequivalentという話がある。これを2x2の場合について、a,tでパラメタライズした場合との関係を考えてみる。
- 2x2複素行列をとする。
- であるから
-
- を右辺に代入して、式変形すると。。。
- が得られる。さらに変形して
- となる。
- ここから、, が得られる。
- ととの制約は分離されていて次のような制約にまとめられる。
- , ,
- 射影行列のことを別の観点から考えてみる
v <- runif(3) + 1i * runif(3) v. <- v/sqrt(sum(Mod(v)^2)) sum(Mod(v.)^2) # 1 v.m <- matrix(v.,ncol=1) p <- v.m %*% t(Conj(v.m)) eigen(p) -> eigen.out v.m / eigen.out[[2]][,1] v.m / eigen.out[[2]][,1] -> a Mod(a[1]) p %*% v.m -> q q/v.m
a <- 0.3 t <- 0.2 r <- sqrt(a*(1-a) + 0 * 1i) M <- matrix(c(a, r * exp(1i * t), r * exp(-1i * t), 1-a),byrow=TRUE,2,2) M M %*% M round(M%*% M - M) # 0 Conj(t(M)) round(Conj(t(M)) - M) # 0 eout <- eigen(M) round(eout[[1]]) # 固有値は1と0 ev1 <- c((a+0*1i)^0.5 * exp(1i *t),(1-a+0*1i)^0.5) ev2 <- c(-(1-a+0*1i)^0.5 * exp(1i * t), (a+0*1i)^0.5) ev1 <- ev1 / sqrt(sum(Mod(ev1)^2)) ev2 <- ev2 / sqrt(sum(Mod(ev2)^2)) sum(Mod(ev1)^2) sum(Mod(ev2)^2) sum(Mod(eout[[2]][,1])^2) sum(Mod(eout[[2]][,2])^2) eout[[2]][,1]/ev1 Mod(eout[[2]][,1]/ev1) cbind(ev1,ev2) / eout[[2]] Mod(cbind(ev1,ev2) /eout[[2]])
> round(M%*% M - M) # 0 [,1] [,2] [1,] 0+0i 0+0i [2,] 0+0i 0+0i > round(Conj(t(M)) - M) # 0 [,1] [,2] [1,] 0+0i 0+0i [2,] 0+0i 0+0i > round(eout[[1]]) # 固有値は1と0 [1] 1 0 > sum(Mod(ev1)^2) [1] 1 > sum(Mod(ev2)^2) [1] 1 > sum(Mod(eout[[2]][,1])^2) [1] 1 > sum(Mod(eout[[2]][,2])^2) [1] 1 > eout[[2]][,1]/ev1 [1] -0.9800666+0.1986693i -0.9800666+0.1986693i > Mod(eout[[2]][,1]/ev1) [1] 1 1 > cbind(ev1,ev2) / eout[[2]] ev1 ev2 [1,] -0.9800666-0.1986693i 0.9800666+0.1986693i [2,] -0.9800666-0.1986693i 0.9800666+0.1986693i > Mod(cbind(ev1,ev2) /eout[[2]]) ev1 ev2 [1,] 1 1 [2,] 1 1
a <- -0.3 t <- 0.2 r <- sqrt(a*(1-a) + 0 * 1i) M <- matrix(c(a, r * exp(1i * t), r * exp(-1i * t), 1-a),byrow=TRUE,2,2) M M %*% M round(M%*% M - M) # 0 Conj(t(M)) round(Conj(t(M)) - M) # 0 eout <- eigen(M) round(eout[[1]]) # 固有値は1と0 ev1 <- c((a+0*1i)^0.5 * exp(1i *t),(1-a+0*1i)^0.5) ev2 <- c(-(1-a+0*1i)^0.5 * exp(1i * t), (a+0*1i)^0.5) ev1 <- ev1 / sqrt(sum(Mod(ev1)^2)) ev2 <- ev2 / sqrt(sum(Mod(ev2)^2)) sum(Mod(ev1)^2) sum(Mod(ev2)^2) sum(Mod(eout[[2]][,1])^2) sum(Mod(eout[[2]][,2])^2) eout[[2]][,1]/ev1 Mod(eout[[2]][,1]/ev1) cbind(ev1,ev2) / eout[[2]] Mod(cbind(ev1,ev2) /eout[[2]])
> round(M%*% M - M) # 0 [,1] [,2] [1,] 0+0i 0+0i [2,] 0+0i 0+0i > round(Conj(t(M)) - M) # 0 [,1] [,2] [1,] 0+0i 0-1i [2,] 0-1i 0+0i > round(eout[[1]]) # 固有値は1と0 [1] 1.000000e+00+0i -2.220446e-16+0i > sum(Mod(ev1)^2) [1] 1 > sum(Mod(ev2)^2) [1] 1 > sum(Mod(eout[[2]][,1])^2) [1] 1 > sum(Mod(eout[[2]][,2])^2) [1] 1 > eout[[2]][,1]/ev1 [1] 1+0i 1+0i > Mod(eout[[2]][,1]/ev1) [1] 1 1 > cbind(ev1,ev2) / eout[[2]] ev1 ev2 [1,] 1-0i -0.9800666-0.1986693i [2,] 1+0i -0.9800666-0.1986693i > Mod(cbind(ev1,ev2) /eout[[2]]) ev1 ev2 [1,] 1 1 [2,] 1 1
- の確認
a <- 0.25 + 0 * 1i r1 <- rep(0.1 + 0 * 1i,4) r2 <- c((a-r1^2)^0.5,(a-r1^2)^0.5,-(a-r1^2)^0.5,-(a-r1^2)^0.5) r3 <- c(((1-a)/a)^0.5 * r1,-((1-a)/a)^0.5 * r1,((1-a)/a)^0.5 * r1,-((1-a)/a)^0.5 * r1) r4 <- r2 * r3 / r1 theta1 <- runif(1) theta2 <- runif(1) theta3 <- runif(1) theta4 <- theta2 + theta3 - theta1 for(i in 1:4){ u <- matrix(c(r1[i] * exp(1i * theta1), r2[i] * exp(1i * theta2), r3[i] * exp(1i * theta3), r4[i] * exp(1i * theta4)), byrow=TRUE,2,2) ustar <- ustar <- t(Conj(u)) p <- u %*% ustar q <- ustar %*% u print(p - t(Conj(p))) # 0 : p = p* print(round(p %*% p - p)) # 0 : p^2 = p print(q - t(Conj(q))) # 0 : q = q* print(round(q %*% q - q)) # 0 : q^2 = q }
ぱらぱらめくる『作用素環の考え方』
- 作用素環の考え方(PDF)
- 作用素環とは「ヒルベルト空間全体で定義された有界作用素であって、自己共役演算に関して閉じているような作用素の集合であって、その集合が置かれているバナッハ空間の中で位相的に閉じているもののことである。そしてそれは完備にもなる。この位相的に閉じているというときの位相のとり方で異なる作用素環が作れる。代表例はC*環とフォン・ノイマン環」と言える。そのことが以下の手順で説明されている。
- 作用素環論は代数でもあるが、関数解析的
- 代数の立場から:「なぜ、作用素の『環』を扱うのか」
- さらに2つの条件を付けて考えることにする
- 1つめ:「自己共役」
- 2つめ:「完備性」
- 「完備性」〜「バナッハ空間の中で『適当な位相』で閉じている」
- 環と空間
- 作用素環を扱いやすく制限して考える〜従順性
- 離散群があると群環を経由して作用素環が作れるという事実がある
- 離散群はいくらでも変なものが作れることで有名であることからも分かる通り、作用素環にもいくらでも変なものが作れてしまい、分類しにくい〜分類の役に立つような不変量が定まらない
- 作用素環に条件をつけて不変量が取れるようにするという作戦もあり
- 実際、非可換幾何のA. コンヌは、解析的に良い条件を仮定した作用素環には、簡単な不変量が完全不変量となることを示した
- このような条件を満たすことを「従順」と言う
- 従順なC*環は完全不変量を持つはずで、それによる分類定理を得ようとしているのがElliot program
- 従順でない作用素環は分類しがたいが、従順でないフォン・ノイマン環について「違う作り方をしたフォン・ノイマン環は本当に違う」というような理解の仕方でそれなりの分類的考え方が導入されている
- これ以降は、物理っぽいので割愛