Daniil Tiapkin's picture

2 3

Daniil Tiapkin

dtiapkin

·

https://d-tiapkin.github.io/

AI & ML interests

Reinforcement learning enjoyer

Recent Activity

authored a paper 11 days ago

Accelerating Nash Learning from Human Feedback via Mirror Prox

upvoted a paper 11 days ago

Accelerating Nash Learning from Human Feedback via Mirror Prox

commented on a paper 11 days ago

Accelerating Nash Learning from Human Feedback via Mirror Prox

View all activity

Organizations

None yet

dtiapkin's activity

commented a paper 11 days ago

Accelerating Nash Learning from Human Feedback via Mirror Prox

Paper • 2505.19731 • Published 12 days ago • 6 •

commented a paper 4 months ago

On Teacher Hacking in Language Model Distillation

Paper • 2502.02671 • Published Feb 4 • 18 •