feature(xjx): new style dist version, add storage loader and model loader #425

sailxjx · 2022-07-22T08:27:15Z

Description

Related Issue

TODO

Check List

merge the latest version source branch/repo, and resolve all the conflicts
pass style check
pass all the tests

…xt exchanger

…n on tensor

codecov · 2022-07-25T02:20:25Z

Codecov Report

❗ No coverage uploaded for pull request base (dev-dist@c350bae). Click here to learn what that means.
The diff coverage is n/a.

@@             Coverage Diff             @@
##             dev-dist     #425   +/-   ##
===========================================
  Coverage            ?   85.50%           
===========================================
  Files               ?      542           
  Lines               ?    43009           
  Branches            ?        0           
===========================================
  Hits                ?    36776           
  Misses              ?     6233           
  Partials            ?        0

Flag	Coverage Δ
unittests	`85.50% <0.00%> (?)`

Flags with carried forward coverage won't be shown. Click here to find out more.

Continue to review full report at Codecov.

Legend - Click here to learn more
Δ = absolute <relative> (impact), ø = not affected, ? = missing data
Powered by Codecov. Last update c350bae...c896504. Read the comment docs.

* demo(nyz): add naive dp demo * demo(nyz): add naive ddp demo * feature(nyz): add naive tb_logger in new evaluator * Add singleton log writer * Use get_instance on writer * feature(nyz): add general logger middleware * feature(nyz): add soft update in DQN target network * fix(nyz): fix termination env_step bug and eval task.finish broadcast bug * Support distributed dqn * Add more desc (ci skip) * Support distributed dqn Add more desc (ci skip) Add timeout on model exchanger * feature(nyz): add online logger freq * fix(nyz): fix policy set device bug * add offline rl logger * change a bit * add else in checking ctx type * add test_logger.py * add mock of offline_logger * add mock of online writer * reformat * reformat * feature(nyz): polish atari ddp demo and add dist demo * fix(nyz): fix mq listen bug when stop * demo(nyz): add atari ppo(sm+ddp) demo * demo(nyz): add ppo ddp avgsplit demo * demo(nyz): add ditask + pytorch ddp demo * fix(nyz): fix dict-type obs bugs * fix(nyz): fix get_shape0 bug when nested structure * Route finish event to all processes in the cluster * demo(nyz): add naive dp demo * demo(nyz): add naive ddp demo * feature(nyz): add naive tb_logger in new evaluator * feature(nyz): add soft update in DQN target network * fix(nyz): fix termination env_step bug and eval task.finish broadcast bug * Add singleton log writer * Use get_instance on writer * feature(nyz): add general logger middleware * Support distributed dqn * Add more desc (ci skip) * Support distributed dqn Add more desc (ci skip) Add timeout on model exchanger * feature(nyz): add online logger freq * fix(nyz): fix policy set device bug * add offline rl logger * change a bit * add else in checking ctx type * add test_logger.py * add mock of offline_logger * add mock of online writer * reformat * reformat * feature(nyz): polish atari ddp demo and add dist demo * fix(nyz): fix mq listen bug when stop * demo(nyz): add atari ppo(sm+ddp) demo * demo(nyz): add ppo ddp avgsplit demo * demo(nyz): add ditask + pytorch ddp demo * fix(nyz): fix dict-type obs bugs * fix(nyz): fix get_shape0 bug when nested structure * Route finish event to all processes in the cluster * refactor(nyz): split dist ddp demo implementation * feature(nyz): add rdma test demo(ci skip) * feature(xjx): new style dist version, add storage loader and model loader (#425) * Add singleton log writer * Use get_instance on writer * feature(nyz): polish atari ddp demo and add dist demo * Refactor dist version * Wrap class based middleware * Change if condition in wrapper * Only run enhancer on learner * Support new parallel mode on slurm cluster * Temp data loader * Stash commit * Init data serializer * Update dump part of code * Test StorageLoader * Turn data serializer into storage loader, add storage loader in context exchanger * Add local id and startup interval * Fix storage loader * Support treetensor * Add role on event name in context exchanger, use share_memory function on tensor * Double size buffer * Copy tensor to cpu, skip wait for context on collector and evaluator * Remove data loader middleware * Upgrade k8s parser * Add epoch timer * Dont use lb * Change tensor to numpy * Remove files when stop storage loader * Discard shared object * Ensure correct load shm memory * Add model loader * Rename model_exchanger to ModelExchanger * Add model loader benchmark * Shutdown loaders when task finish * Upgrade supervisor * Dont cleanup files when shutting down * Fix async cleanup in model loader * Check model loader on dqn * Dont use loader in dqn example * Fix style check * Fix dp * Fix github tests * Skip github ci * Fix bug in event loop * Fix enhancer tests, move router from start to __init__ * Change default ttl * Add comments Co-authored-by: niuyazhe <[email protected]> * style(nyz): correct yapf style * fix(nyz): fix ctx and logger compatibility bugs * polish(nyz): update demo from cartpole v0 to v1 * fix(nyz): fix evaluator condition bug * style(nyz): correct flake8 style * demo(nyz): move back to CartPole-v0 * fix(nyz): fix context manager env step merge bug(ci skip) * fix(nyz): fix context manager env step merge bug(ci skip) * fix(nyz): fix flake8 style Co-authored-by: Xu Jingxin <[email protected]> Co-authored-by: zhumengshen <[email protected]>

sailxjx and others added 30 commits June 17, 2022 11:48

Add singleton log writer

545d3e8

Use get_instance on writer

759968d

feature(nyz): polish atari ddp demo and add dist demo

4b8e12e

Refactor dist version

34e5154

Wrap class based middleware

ade2231

Change if condition in wrapper

60e6d85

Only run enhancer on learner

33b53e7

Support new parallel mode on slurm cluster

6d861b6

Temp data loader

8ea6559

Stash commit

10943f9

Init data serializer

f9c1f85

Update dump part of code

9c9b2e2

Test StorageLoader

a21270d

Turn data serializer into storage loader, add storage loader in conte…

b57837d

…xt exchanger

Add local id and startup interval

9cd6bea

Fix storage loader

fa3bcd8

Support treetensor

c1360fd

Add role on event name in context exchanger, use share_memory functio…

3a83646

…n on tensor

Double size buffer

8bb3295

Copy tensor to cpu, skip wait for context on collector and evaluator

10bf11f

Remove data loader middleware

56cf6ac

Upgrade k8s parser

7597787

Add epoch timer

56c984b

Dont use lb

2fa6aea

Change tensor to numpy

f8c1f41

Remove files when stop storage loader

074d6ba

Discard shared object

f90472c

Ensure correct load shm memory

11b6f16

Add model loader

a43948d

Rename model_exchanger to ModelExchanger

ddca885

sailxjx added 10 commits July 21, 2022 15:28

Add model loader benchmark

9f5087b

Shutdown loaders when task finish

c5c2909

Upgrade supervisor

ed7acce

Dont cleanup files when shutting down

3d71c1e

Fix async cleanup in model loader

6854e86

Check model loader on dqn

870d683

Dont use loader in dqn example

7059952

Fix style check

73f706e

Merge branch 'dev-dist' into dev-data-loader

c43f8cf

Fix dp

48713d7

PaParaZz1 added efficiency optimization Efficiency optimization (time, memory and so on) refactor refactor module or component labels Jul 22, 2022

Fix github tests

cacb257

sailxjx added 5 commits July 25, 2022 10:53

Skip github ci

4276ee3

Fix bug in event loop

ba5f638

Fix enhancer tests, move router from start to __init__

134891a

Change default ttl

a51017d

Add comments

c896504

PaParaZz1 merged commit 0206137 into dev-dist Sep 8, 2022

PaParaZz1 deleted the dev-data-loader branch September 8, 2022 16:22

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

feature(xjx): new style dist version, add storage loader and model loader #425

feature(xjx): new style dist version, add storage loader and model loader #425

sailxjx commented Jul 22, 2022

codecov bot commented Jul 25, 2022 •

edited

Loading

feature(xjx): new style dist version, add storage loader and model loader #425

feature(xjx): new style dist version, add storage loader and model loader #425

Conversation

sailxjx commented Jul 22, 2022

Description

Related Issue

TODO

Check List

codecov bot commented Jul 25, 2022 • edited Loading

Codecov Report

codecov bot commented Jul 25, 2022 •

edited

Loading