Data-Training and Eval - a sheikhjubair Collection

sheikhjubair 's Collections

reasoning-agentic

Data-Training and Eval

Data-Training and Eval

updated Jun 1

InfinityMATH: A Scalable Instruction Tuning Dataset in Programmatic Mathematical Reasoning

Paper • 2408.07089 • Published Aug 9, 2024 • 14
HelloBench: Evaluating Long Text Generation Capabilities of Large Language Models

Paper • 2409.16191 • Published Sep 24, 2024 • 43
Training Language Models to Self-Correct via Reinforcement Learning

Paper • 2409.12917 • Published Sep 19, 2024 • 141
Self-Boosting Large Language Models with Synthetic Preference Data

Paper • 2410.06961 • Published Oct 9, 2024 • 17
Trillion 7B Technical Report

Paper • 2504.15431 • Published Apr 21 • 38
CLIMB: CLustering-based Iterative Data Mixture Bootstrapping for Language Model Pre-training

Paper • 2504.13161 • Published Apr 17 • 93
Are Reasoning Models More Prone to Hallucination?

Paper • 2505.23646 • Published May 29 • 25