Persistent Homology
A Persistent Weisfeiler–Lehman Procedure for Graph Classificationを読んでいてPersistent Homologyとは?となったので、調べた内容をまとめる。
Motivation
[1]
目標として、データの幾何学的構造を捉えたい。リング状になっているデータ点の集合あったとして、点ごとに見ると、離散的でリングが見えない。点を肥大化していくとリングが現れるが肥大化しすぎるとリングが潰れてしまう。これを、あらゆる肥大化について考えることで(Persistent: 永続的 にすることで)、データの幾何学的構造をうまく見つけようというモチベーション。
[2]
1つ目の図では肥大化を、その点を中心とする球の大小みたいなイメージで説明したが、別に特定のメトリックならなんでもいい(後述)。2つ目の人っぽいやつの図はどんなメトリックによってresolutionを変えているかわからないけど球の大小みたいなのでなくても大丈夫。いずれにせよresolutionを変えるという表現はかなり適切っぽい。
Filteration
[2]
距離が定められた空間において、各点から距離が以下になるような距離空間内の点からなる集合をと定めており、距離の増加列について対応するの列をfilterationという。
これはまさにMotivationのところで説明した解像度を変えたときのデータの列のことである。
barcode, BD図
各幾何学的特徴(後述;connected components, cycles, voidsなど)について、それらがどのタイミング(どの)で発生し、どのタイミングで消失したかを表す図。
[1]
birthとdeathのペアを二次元平面で表したのがBD図。数直線で表したものがバーコード。BD図はなのですべての点はより上側にある。また、付近の特徴はノイズとされることが多い。
[3]
幾何学的特徴の見つけ方
これが要するにHomologyらしい。Homologyについての知見が足りなさすぎるのであまり書けることがない。いつかまとめ直すかもしれない
[3]
図、わかりにくいかもしれないが黄色は面を表していて、白は空洞だと思う。図では穴が1つ
参考文献
[3] Persistent Homology An Introduction and a New Text Representation for Natural Language Processing
感想
調べたら近年のICMLにわりと関連研究があってそれなりに人気っぽい。聞いたことなかったけど。一旦知ってしまうとWL kernelに応用しようとするアイデアはあまりに自然に思えるけどここ数年まったく出なくてこのタイミング突然出てきたのはわりとびっくり。WL kernelが強くなるとGraph Isomorphism Networkが強くなるのでこれの応用が秋のもろもろの学会で大量に出そうな予感がする。