タグ数を徐々に増やしながら学習するオプションの追加、persistent_workersに関する軽微なバグ修正 #322

u-haru · 2023-03-24T09:47:36Z

token_warmup

token_warmup_minを基準として、token_warmup_stepになるまで徐々にタグ数を増やしながら学習させる実装です。どれだけ効果があるかは未知数ですが、学習したい要素以外のtokenへの影響が多少軽減されるはずです。

torch.utils.data.DataLoaderの関係でエポック毎にしか変更されないため、少ないエポック数だと正常に動作しない可能性があります。

persistent_workersに関する軽微なバグ修正

persistent_workers使用時にcaption_dropout_every_n_epochsを使うと、エポック毎のワーカーのリセットがされない関係でset_current_epoch()が作用しなくなり、caption_dropout_every_n_epochsが使えなくなります(上記のtoken_warmupも同様)。

なので、競合時はargs.persistent_data_loader_workersをFalseに書き変えるようにしました。

思いつきの実装&修正なので、必要なければcloseしてもらって大丈夫です。

kohya-ss · 2023-03-24T13:23:55Z

PRありがとうございます。タグを徐々に増やすのは興味深いですね。ただ効果は限定的な気もしますので、コード追加とメンテナンスコストを考える必要がありそうです。

またpersistent_workers使用時の問題の件ですが、set_current_epoch()自体が呼ばれなくなる、ということでよろしいでしょうか。もしそうだとすると、そこでdatasetのshuffleをしているので別の問題がありそうです。

ただ手元で試したところ、persistent_data_loader_workersを指定しても、メソッドは呼ばれているようでした。何か呼ばれなくなる追加の条件等があるのでしょうか。お教えいただければ幸いです。

u-haru · 2023-03-24T20:08:29Z

効果はメンテナンスコストに比べると確かに低そうです(実際効果あるのか分かってないので…)
ホントに思いつきだったのでその辺は深く考えてませんでした、すみません

persistent_workersについてですが、
1．タグ数変化の動作を確かめるためにprocess_caption()内でprintしながら確かめていたが、全く変化しなかった
2．set_current_step()等は正しく呼ばれていた
3．persistent_workersを無効化すると、epochの変わり目でタグ数が変化するようになった
といった経緯で気づきました。

恐らくですがtorch.utils.data.DataLoaderがデータセットをコピーしていて、train_dataset_groupとDataLoaderから呼ばれるデータセットが別のものを参照しているのではないかと思います。
それで学習時に
・関数が呼ばれてるのはtrain_dataset_group
・実際にデータをロードしてるのはDataLoaderの内部のデータセット
みたいなことになっているのかなと(persistent_workers無効時はエポック毎に再コピーしてる？)。
実際に学習時のtrain_dataset_group.set_current_epoch()等をコメントアウトしてから学習直前にdel train_dataset_groupをしてみたのですが、問題なく動作しちゃってるので…
DataLoaderは動的なデータセットが想定されてないのかもしれません。

kohya-ss · 2023-03-25T01:25:04Z

効果はメンテナンスコストに比べると確かに低そうです(実際効果あるのか分かってないので…)
ホントに思いつきだったのでその辺は深く考えてませんでした、すみません

いえ、直感的には効果ありそうですし（学習率のwarm upと組み合わせても面白いかもしれません）、コストもそこまで大きくないのですが、一度オプションを追加してしまうと削除はなかなか難しいので……。比較結果などあると良いのですが……。

またpersistent_workersとDataLoaderについての詳細、ありがとうございます。お書きいただいた内容を元に改めてこちらでも確認してみましたが、たしかに実際のDataLoaderから呼ばれるdatasetのインスタンスでは、set_current_epochが呼ばれていないようでした。

恐らくですがtorch.utils.data.DataLoaderがデータセットをコピーしていて、train_dataset_groupとDataLoaderから呼ばれるデータセットが別のものを参照しているのではないかと思います。

こちらのご推測が正しいようです。

ただWindowsではpersistent_data_loader_workersを指定しないとepochの切り替わりが極めて遅くなりますし、また単にデータを繰り返して1 epochを長くする方法では（このPRを含めて）epoch単位で何かする機能に影響が出ますので、何かうまい方法を考える必要がありそうです。
（なんらかの方法でepochの切り替わりをコピーされたdataset側に伝えるなど。）

…cripts into feature/token_warmup

u-haru · 2023-03-25T17:12:46Z

multiprocessingのValueを使ってcollater_fn側から送信することで、一応stepとepochの両方をステップ毎に送ることが出来るようになりました。ただこの実装は結構無理やりな気もします。

(あとcommitミスしてログが汚くなってしまいました、すみません)

kohya-ss · 2023-03-26T07:59:53Z

ありがとうございます！　collater_fnとValueを使うことでプロセス間で値の受け渡しができているようです。PythonにもPyTorchにもそこまで明るくないのでたいへん助かります。

また他のスクリプトへの対応もありがとうございます。タグ数の増加はむしろfine tuningの方が有効な気がしますね。

このままマージさせていただきます。

u-haru added 5 commits March 23, 2023 07:37

implement token warmup

a9b26b7

typo修正、stepをglobal_stepに修正、バグ修正

447c56b

persistent_workersを有効にした際にキャプションが変化しなくなるバグ修正

dbadc40

競合時にpersistant_data_loader側を無効にするように変更

143c26e

シャッフル前にタグを切り詰めるように変更

1b89b2a

u-haru added 3 commits March 26, 2023 01:41

データセットにepoch、stepが通達されないバグ修正

5ec9099

データセットにepoch、stepが通達されないバグ修正

292cdb8

Merge branch 'feature/token_warmup' of https://github.com/u-haru/sd-s…

9c80da6

…cripts into feature/token_warmup

u-haru added 3 commits March 26, 2023 02:19

lora以外も対応

4dc1124

print削除

5a3d564

blueprint_args_conflictは不要なため削除、shuffleが毎回行われる不具合修正

a4b34a9

kohya-ss merged commit 4f42f75 into kohya-ss:dev Mar 26, 2023

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

タグ数を徐々に増やしながら学習するオプションの追加、persistent_workersに関する軽微なバグ修正 #322

タグ数を徐々に増やしながら学習するオプションの追加、persistent_workersに関する軽微なバグ修正 #322

u-haru commented Mar 24, 2023

kohya-ss commented Mar 24, 2023

u-haru commented Mar 24, 2023

kohya-ss commented Mar 25, 2023

u-haru commented Mar 25, 2023

kohya-ss commented Mar 26, 2023

タグ数を徐々に増やしながら学習するオプションの追加、persistent_workersに関する軽微なバグ修正 #322

タグ数を徐々に増やしながら学習するオプションの追加、persistent_workersに関する軽微なバグ修正 #322

Conversation

u-haru commented Mar 24, 2023

token_warmup

persistent_workersに関する軽微なバグ修正

kohya-ss commented Mar 24, 2023

u-haru commented Mar 24, 2023

kohya-ss commented Mar 25, 2023

u-haru commented Mar 25, 2023

kohya-ss commented Mar 26, 2023