Joeの精進記録

旧:競プロ練習記録

A Persistent Weisfeiler–Lehman Procedure for Graph Classification

Persistent Homologyをまったく知らない人は先にhttps://xuzijian629.hatenadiary.jp/entry/2019/07/20/192722を読んでください。

Super Simplified Overview

f:id:xuzijian629:20190720203406p:plain

あまりに本質な画像なんですが、グラフのNodeにWeisfeiler-Lemanの方法に従ってラベルを付けていき、 h回目のイテレーションにおける、各辺の重みをmultisetの距離(後ほど定義)で与えてやり、重み付きラベル付きグラフを構成する。こうしてできたグラフについてPersistent Homologyを考えてやり、ラベル付きバーコードを生成することで、連結成分やサイクルの情報を含んだグラフの情報が得られる。

Weisfeiler-Lehman Stabilization

WLの詳細は省くが、 h回目のイテレーションにおける特徴量ベクトルは、色 i = 1, \ldots, mのラベルがこの時点でいくつ存在するかまとめた長さ mのベクトルで与えられる。 グラフ Gの特徴量ベクトルは、各イテレーションの結果の長さ mのベクトルをconcatして得られる。

有名な話だけどWL testでは区別できないグラフもある。より表現力を強めるためにトポロジカルな情報を含めたいというのがこの論文のモチベーション

Topological Features

位相空間 Mについて、 k次元のtopological featureとは、ホモロジー H_k(M)のことを指す。とくに、 k = 0, 1についてはそれぞれconnected components, cyclesと名前がついている。明らかに、同型なグラフはこれらの要素数が同じになる。

ホモロジー群の詳細は知らなくてもしばらくは読めそう。

Persistent Homology

ほとんどのグラフにおいて、連結成分数やサイクル数を見るだけだと情報が雑すぎるので、Persitent Homologyを考える。次のようなグラフのfilterationを考える。

 \emptyset \subset G_0 \subset G_1 \subset \ldots \subset G_{k - 1} \subset G_k = G

ここで、それぞれの G_i = (V, E_i \subset E)は頂点集合は同じだが、辺の数が増えていっている。すなわち、連結成分数はかならず広義単調減少で、サイクル数は広義単調増加となる。

Persistent homologyは各 G_iの連結成分数とサイクル数を記録する。

もう少し詳しく読み込もうと思ったがしばらくNeurIPS rebuttalで忙しそうなので中断

参考文献

[1] A Persistent Weisfeiler–Lehman Procedure for Graph Classification