2020-01-21

卒論名言集

1年前の卒論関連のSlackを見返していたらわりと面白かったのでまとめます

ちなみに締切は2/1だったみたいです。

1/19

DDCCの装置実装部門の話で盛り上がっている

1/20

けんしん「またライブラリの闇と戦っていたら1日が終了しかけている」

1/21

f:id:xuzijian629:20200121162623p:plain

f:id:xuzijian629:20200121162615p:plain

f:id:xuzijian629:20200121162711p:plain

（ラボ内締切というか、校正が必要なので初稿を1/24までに出してくださいみたいな話だった気がします）

1/22

ぼくがこどふぉで黄色になってやっとDiv2 & えづほから開放される

1/23

f:id:xuzijian629:20200121162914p:plain

1/24

f:id:xuzijian629:20200121162937p:plain

けんしんがnumpyの仕様と一日中戦っていた

f:id:xuzijian629:20200121163049p:plain

1/25

f:id:xuzijian629:20200121163204p:plain

1/26

f:id:xuzijian629:20200121163241p:plain

1/27

けんしんがインフル新薬の耐性菌のせいで熱が続いていてまだ登校できない問題

f:id:xuzijian629:20200121163414p:plain

1/28

けんしんの熱が下がる

f:id:xuzijian629:20200121163446p:plain

やっと実験結果が出たらしい

じょえたぷにきあくん笑が初稿を提出する。30枚5800 words

1/29

熱は下がったけど登校できないけんしん

f:id:xuzijian629:20200121163610p:plain

1/30 締切前日

やっとけんしんが登校。ほぼ大学にいたのであんまりSlackで話したことがない

2/1 締切

必死すぎてSlackの投稿が皆無。たぶんけんしんは一晩で2000 wordsぐらい生成してそう

2020-01-06

define-by-runじゃないと困る問題

Hanjun-Daiのgraphnnがdefine-by-runじゃないせいで困った

複数グラフの、頂点ごとの確率を推論して、CrossEntropyしたい状況

batchあたりのlossを定義するために入力は複数グラフ(ひとつずつやってlossを足すということはできない)
グラフごとにCrossEntropyを計算したい
グラフの最大ノード数を固定したくない
でもsoftmaxするときに最大ノード数でreshapeしたい
muriyarokonnnan

2020-01-03

強化学習アルゴリズム整理

久しぶりにPolicy Gradientやろうとしたら全部忘れていた

DQN

アルゴリズム

とりあえずプレイアウトして $(S, a, r)$ をreplay memoryに保存する
$(S, a, r)$ と、その $n$ ステップ後の $(S', a', r')$ を取り出してきて、後者の価値を古いネットワークで推定し、そこからrewardを逆算した前者の価値に近づけるように、新しいネットワークを学習させる
数iter学習したら古いネットワークを新しくする

いいところ

replay memoryに保存してまとめてとってくるので、まとめて推論できて、高速だしsample efficient

Policy Gradient

アルゴリズム

期待報酬 $J(\theta)$ を最大化するように学習する
$\pi(s | a; \theta)$ は確率的
この勾配はpolicy gradient theoremによって求まる

f:id:xuzijian629:20200103190739p:plain

sykwerくんの記事が優秀

sykwer.hatenablog.jp

いいところ

まあこれも $M$ エピソード分の推論は同時にできるしそんなにスピード悪くなさそう
DQNに比べて何がいいのかわからんな

MCTS

アルゴリズム

未展開ノードについたらその評価を推論して、そこまでのノードの評価をupdateする
visit回数に応じて、より強いpolicyを構築し、それに合わせるように学習する
スコアは相対的なものにする

いいところ

探索があるので、一般に普通の評価より強いと思う
DQNのやつと組み合わせたらさすがにDQNより強いはずでは

2020-01-01

Dynamic Connectivityについて

kopricky.github.io

なんかやばすぎる記事を発見した。めっちゃ研究を追ってみたいけど人生が終了しそう

2020-01-01

2020年の抱負

今年の目標は

ICML/NeurIPS/AAAI/ICLRのどれかに通す
グラフアルゴリズム系の学会のどれかに通す
強いメンタルをもつ

です。がんばるぞ〜

2019-12-30

S2V-DQNコードリーディング

https://xuzijian629.hatenadiary.jp/entry/2019/07/27/154356

以前環境構築についてまとめた

今回は実装を読んでいく。

MVCについて読むが多分構造は他も一緒

構造

eps_start = 1.0
eps_end = 0.05
eps_step = 10000.0
for iter in range(int(opt['max_iter'])):
    if iter and iter % 5000 == 0:
        gen_new_graphs(opt)
    eps = eps_end + max(0., (eps_start - eps_end) * (eps_step - iter) / eps_step)
    if iter % 10 == 0:
        api.lib.PlayGame(10, ctypes.c_double(eps))

    if iter % 300 == 0:
        frac = 0.0
        for idx in range(n_valid):
            frac += api.lib.Test(idx)
        print 'iter', iter, 'eps', eps, 'average size of vc: ', frac / n_valid
        sys.stdout.flush()
        model_path = '%s/nrange_%d_%d_iter_%d.model' % (opt['save_dir'], int(opt['min_n']), int(opt['max_n']), iter)
        api.SaveModel(model_path)

    if iter % 1000 == 0:
        api.TakeSnapshot()

    api.lib.Fit()

流れはこんな感じ。もろもろの関数はmvc_lib.cppにある。

5000 iterおきにグラフをgen_new_graphsをしている。内部的にはグラフのプールを更新している。プールには1000個グラフがある(main.py)
epsilon greedyのepsをだんだん小さくしているっぽい
10 iterおきにPlayGameしている。10回最初からterminal stateまで実行して、結果の列をNStepReplayMemに格納する。毎回グラフをプールからサンプルするっぽい。
1000 iterおきにSnapShotをとっている。これが実は本質っぽいんだけど、lossの計算ではこの記事の一番下に書いてあるように、Snapshotをとったold_modelと、新しいmodelでの2つの予測結果の二乗誤差を考えている
毎iterでFitしている。これは、batch_sizeサンプルしてきて、nn_api.cppのFitを呼んでいる。

net->SetupTrain(batch_idxes, g_list, covered, actions, target);
net->fg.FeedForward({net->loss}, net->inputs, Phase::TRAIN);
net->fg.BackPropagate({net->loss});
net->learner->Update();

loss += net->loss->AsScalar() * bsize;

みたいなことが行われている。誤差の計算のところはmvc_lib.cppにあって

PredictWithSnapshot(sample.g_list, sample.list_s_primes, list_pred);

からの

for (int i = 0; i < cfg::batch_size; ++i)
{
    double q_rhs = 0;
    if (!sample.list_term[i])
        q_rhs = max(sample.g_list[i]->num_nodes, list_pred[i]->data());
    q_rhs += sample.list_rt[i];
    list_target[i] = q_rhs;
}

が行われている。PredictWithSnapshotは古いモデルでの予測結果っぽい。

のところ。

2019-12-25

On the complexity of the embedding problem for hypercube related graphs

www.sciencedirect.com

説　明　が　ウ　ン　チ　ー　コ　ン　グ

writerやめろ

概要

「木 $T$ と、正整数 $k$ が与えられたとき、 $T$ を $k$ 次元hypercubeに埋め込めるか」という判定問題はNP-Complete.

まあこれが成り立つので、 $T$ はより一般にグラフ $G$ に拡張できる。

証明がExact Cover by 3-sets (X3C)によるもので、これまたテクニカル

X3C

集合 $X$ の部分集合で、サイズ3のものをいくつか集めた集合 $C$ が与えられる(Cは集合の集合)。 $C$ の部分集合で、 $X$ のdisjointな分割になっているもの $C'$ が存在するか(このとき $C'$ は $X$ をカバーしている)

これはNP-Completeらしい。 $X$ の要素数が3の倍数でない場合は明らかに不可能なので3の倍数個としてよい。

帰着

X3Cインスタンスが与えられたときに、木 $T$ と $k$ をうまく構築して、「木が $k$ 次元hypercubeに埋め込める」ことと「X3Cインスタンスが解をもつ」ことを同値にしたい。

f:id:xuzijian629:20191225183835p:plain

まず、カバーすべき集合を $X$ としたとき、集合 $S = X \cup {z}$ を考える。また、 $k = |S|$ とする。

木 $T$ が $k$ 次元に埋め込めるかは、 $T$ のノードに、 $S$ の部分集合を割り当てたときに、

異なるノードについて異なる部分集合が割り当てられており
隣接するノードについて、部分集合のset differenceの大きさが1

であることと同値。

$T$ としては上図のように構成する。上図のノード数はみやすさのため少なくなっているが、 $X$ は実は $x_1, \ldots, x_{3q}$ になっており、たとえば $XX$ は $x_1x_1, \ldots, x_{3q}x_{3q}$ になっている。ポイントはノード数がたかだか $3q + 1 = |S|$ の多項式のサイズなので、X3Cのインスタンスが与えられると多項式時間で構築できることである。

図で $R$ の説明がものすごく雑だけど、 $R$ は $q$ 要素で、それぞれ $XXX$ 型の部分集合が割り当てられている。 $C_4$ ノードが $XXX\backslash C$ の型を持っているので、 $XXX$ 型は $C_4$ と $R$ に限られる。もし、 $T$ のノードに割り当てられる集合がすべて異なるなら、 $R \subset C$ が成り立つ。

$R$ と $C_8$ の辺のつなぎ方も重要で、とりあえず $R$ の $i$ 番目のノードに割り当てる部分集合を $x_{3i - 2}x_{3i-1}x_{3i}$ にしておく。これは本当はこうならないかも知れないけど、 $x_k$ のネーミングはあとで適当にある順列によって差し替えることができるので、気にしなくていい。

とりあえずこれで構築は完了

X3Cインスタンスに解がある場合

解 $C'$ は $q$ 要素からなるので、 $R$ と $C_8$ を結ぶ辺は、 $R$ の $j$ 番目の要素とつながっている $C_8$ の要素のラベルを、 $C'$ の $j$ 番目の集合にすればいい。このとき、明らかにノードのラベルは全ノードで異なっているので、 $T$ は $k$ -cubeに埋め込むことができる。

X3Cインスタンスに解がない場合

つまりどう選んでも、 $C'$ の各要素(集合)がdisjointにならない場合。 $R$ が要素数が $q'$ のtex: Cの役割を果たしているので、もし埋め込めるとしたら、そういう $C'$ が見つかって矛盾。

Joeの精進記録

旧：競プロ練習記録

卒論名言集

1/19

1/20

1/21

1/22

1/23

1/24

1/25

1/26

1/27

1/28

1/29

1/30 締切前日

2/1 締切

define-by-runじゃないと困る問題

複数グラフの、頂点ごとの確率を推論して、CrossEntropyしたい状況

強化学習アルゴリズム整理

DQN

アルゴリズム

いいところ

Policy Gradient

アルゴリズム

いいところ

MCTS

アルゴリズム

いいところ

Dynamic Connectivityについて

2020年の抱負

S2V-DQNコードリーディング

構造

On the complexity of the embedding problem for hypercube related graphs

概要

X3C

帰着

X3Cインスタンスに解がある場合

X3Cインスタンスに解がない場合