shakti365 / ppo Public

Notifications You must be signed in to change notification settings
Fork 0
Star 1

TF2 Implementation of Proximal Policy Optimization

1 star 0 forks Branches Tags Activity

Notifications

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
src		src
.gitignore		.gitignore
README.md		README.md
requirements.txt		requirements.txt

Repository files navigation

Proximal Policy Optimization

Implementation of PPO Algorithm in TF2

Notes: https://shivamshakti.dev/posts/ppo

Usage

Create a virtual environment for Python (I use this setup)
Install the dependencies
```
pip install -r requirements.txt
```

Run the training script

cd src
python main.py # Uses `MountainCarContinuous-v0` by default

Run the evaluation script

python play.py --model_name <PATH_TO_SAVED_MODEL>

References

About

TF2 Implementation of Proximal Policy Optimization

Report repository

Releases

No releases published

Packages

No packages published

Languages

Python 100.0%