Priyam05/ppo-CartPole-v1

# PPO Agent Playing CartPole-v1

This is a trained model of a PPO agent playing CartPole-v1.
  
# Hyperparameters
```python
{'exp_name': 'ppo-experiment'

'repo_id': 'Priyam05/ppo-CartPole-v1' 'gym_id': 'CartPole-v1' 'learning_rate': 0.00025 'min_learning_rate_ratio': 0.1 'seed': 1 'total_timesteps': 25000 'torch_not_deterministic': False 'no_cuda': False 'capture_video': False 'hidden_size': 64 'num_hidden_layers': 1 'activation': 'tanh' 'num_checkpoints': 4 'num_envs': 4 'num_steps': 128 'no_lr_annealing': False 'no_gae': False 'gamma': 0.99 'gae_lambda': 0.95 'num_minibatches': 4 'num_update_epochs': 4 'no_advantage_normalization': False 'clip_coef': 0.2 'no_value_loss_clip': False 'ent_coef': 0.01 'vf_coef': 0.5 'max_grad_norm': 0.5 'target_kl': None 'batch_size': 512 'minibatch_size': 128} ```

Priyam05
/

ppo-CartPole-v1

Evaluation results