Reinforcement Learning & Dynamic Optimization - INF423

Assignments

Stochastic Multi-Armed Bandits - Implementation of the UCB algorithm for article suggestion to a class of users.

Adversarial Bandits and Experts - Implementation of the Multiplicative Weights algorithm to optimize our investments in an adversarial environment of stocks.

Markov Decision Processes & (Deep) Reinforcment Learning - Modelling a stock enironment withs MDPs. Developing agents: (i) Policy Iteration (model-based), (ii) Q-Learning (model-free), (iii) Deep-Q Learning (large scale MDP or continuous environment)

Name		Name	Last commit message	Last commit date
Latest commit History 15 Commits
assignment1		assignment1
assignment2		assignment2
assignment3		assignment3
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Reinforcement Learning & Dynamic Optimization - INF423

Assignments

About

Releases

Packages

Languages

atzel-ov/Reinforcement-Learning

Folders and files

Latest commit

History

Repository files navigation

Reinforcement Learning & Dynamic Optimization - INF423

Assignments

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages