The Basics of Reinforcement Learning from Human Feedback

Chapter Contents

[Incomplete] Problem Formulation

Maximizing Expected Reward

TODO: The idea of a “KL Budget” for optimization

Example: Mitigating Safety