latest

User Guide

About
Tutorials

API

Agents
- A2C
- DDPG
- DQN
- PPO1
- VPG
- TD3
- SAC
- Q-Learning
- SARSA
- Contextual Bandit
- Multi-Armed Bandit
Common
Environments
Utilities
Trainers
Core

Torchmm

Docs »
Agents »
Multi-Armed Bandit
Edit on GitHub

Multi-Armed Bandit¶

Base¶

Bayesian Bandit¶

Bernoulli Bandit¶

Espilon Greedy¶

Gaussian¶

Gradient¶

Thmopson Sampling¶

Upper Confidence Bound¶

Next Previous

© Copyright 2020, torchmm Revision 8b6f61ff.

Built with Sphinx using a theme provided by Read the Docs.