Reinforcement Learning Teachers

SakanaAI 's Collections

updated 29 days ago

Students distilled from a 7B Reinforcement-Learned Teacher (RLT) from the paper "Reinforcement Learning Teachers of Test Time Scaling."