2 1 1

Michal Valko

misovalko

large language models, reasoning, fine-tuning, test-time computation, reinforcement learning with human feedback, world models

upvoted a paper 11 days ago

authored a paper 7 months ago

new activity 11 months ago

misovalko's activity

New activity in paris-ai-running-club/README 11 months ago

#3 opened 11 months ago by

New activity in paris-ai-running-club/README about 1 year ago

#1 opened about 1 year ago by