Lightning RND

Reimplementation of "Exploration by Random Network Distillation" aiming to train as fast as possible.

A final project for the course "Advanced Topics in Deep Reinforcement learning" (a report is available in Russian).

Usage

Install all dependencies from either yml or txt file.

Adjust config.yml file as you wish (note the "SavePath", "OptimDevice" and "RunDevice" arguments).

Run model training via

python montezuma_train.py

the trained model can be evaluated with

python montezuma_eval.py

Montezuma Revenge

Training with both intrinsic and extrinsic rewards

Training with intrinsic-only reward

Name		Name	Last commit message	Last commit date
Latest commit History 121 Commits
environments		environments
log_screens		log_screens
models		models
profiling		profiling
training		training
util		util
videos		videos
.gitignore		.gitignore
README.md		README.md
Russian_Report.ipynb		Russian_Report.ipynb
config.yaml		config.yaml
montezuma_eval.py		montezuma_eval.py
montezuma_train.py		montezuma_train.py
requirements.txt		requirements.txt
requirements_gpu.yml		requirements_gpu.yml
requirements_tpu.yml		requirements_tpu.yml