UCL COMP0089 Reinforcement Learning (2023/24)

This repository contains the courseworks I completed for my MSc module COMP0089 Reinforcement Learning.

Tasks

Multi-armed Bernoulli Bandit Problem
- Implemented several agents with the following algorithms:
  - UCB
  - Greedy
  - $\epsilon$-greedy
  - Policy gradient (REINFORCE)
Markov Decision Process
- Implementd several RL algorithms for a MDP:
  - Tabular TD learning
  - Policy iteration
  - Value iteration
- Analysed a MDP
Actor-Critics
- Implemented a deep RL agent using jax.
Off-Policy Learning
- Implemented several off-policy multi-step return estimates:
  - Full importance sampling
  - Per-decision importance sampling (PDIS)
  - PDIS with control variates
  - PDIS with control variates and adaptive bootstrapping
- Analysed the convergence and variance properties of a proposed TD error

Requirement: python=3.11

pip install -r requirements.txt

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
README.md		README.md
RL_part1.ipynb		RL_part1.ipynb
RL_part2.ipynb		RL_part2.ipynb
RL_part3.ipynb		RL_part3.ipynb
RL_part4.ipynb		RL_part4.ipynb
requirements.txt		requirements.txt