2. Persistence and Homology ぱらぱらめくる『Topology and Data』
- 2.1 Introduction
- 2.2 Building coverings and complexes
- 複体のホモロジー計算は線形時間なので、データが作る点の雲を複体化してそのホモロジーを計算することで、元のデータの位相に関する情報が得られたらいいな、と考える。そう考えていいかどうかについて考える
- 位相空間Xがある。可換群Aがあって、その要素を決めると、X上の部分がたくさんできる。そんな部分同士は重なりがあって、Xを覆う。これをcoveringと言う
- k単体は、k+1個のによるcoveringのすべてが、相互に重なりを持つようなときに、そのときにだけ、k単体全体が含まれる。これをnerve(神経)と呼ぶ
- ボロノイ図的に分けることもこのcoveringと関係する
- Cech complexは対象を同半径の球でできた複体。これで対象をうまく覆う方向で考える
- ついで、Cech complexと関係が深い単体複体であるVietoris-Rips complexに変える。Vietoris-Rips complexにも「半径」がある
- 2.3 Persistent homology
- n次元空間上のXのBetti数を、Xからの標本のBettis数を調べることを通じて、推定できるか?という課題
- どの道、正確な推定はできないのだから、Cech complexを作るときの球の半径を固定せず、その長さを可変にして、その長さによって、推定されるホモロジーがどのように変化するかを出力にして(そこから考える)しまおう、と。その半径が変わってもかわらずにpersistentなホモロジーが知りたいものだろう、と考えるので、"persistent homology"。
- 標本について、Cech complex(->Vietoris-Rips complex)をその半径を変えながら探す、という作業をすると、「本当は穴がない」のに「穴あり」のcomplexができることがある
- もちろんその場合にはBetti数は本当とは異なった値になる
- この辺りの工夫が標本からのトポロジー推定の大事な点(の一つ)
- 何故かしら、圏論的定義が出てくる…何かをするのに別のことに写してからやって元に戻したい、ということの前振りなのか…
- 圏、partially ordered set(poset)とか
- Cech complex, Vietoris-Rips complexを実数多次元空間や非負整数多次元空間に作ることは、posetを作ることだ、という…
- Cech/Vietoris-Rips complexesの中でposetを満足するものを見つけて、その集合として全体のトポロジーを表現しよう、という戦略(らしい)
- 2.4 Example: Natural image statistics
- 2.5 Example: Electrode array data from primary visual cortex
- データからトポロジーを導き出すにあたって、ある程度のテンプレートを持たせて行っている
- ここまで読んだら、Rのphomパッケージによる、点集合データのトポロジー推定は使えるのでは…(phomパッケージの使用記事はこちら)