llm - a vikx01 Collection

vikx01 's Collections

llm

llm

updated 20 days ago

LLM Agent Operating System

Paper • 2403.16971 • Published Mar 25, 2024 • 71
On the Generalization of SFT: A Reinforcement Learning Perspective with Reward Rectification

Paper • 2508.05629 • Published 21 days ago • 166
Is Chain-of-Thought Reasoning of LLMs a Mirage? A Data Distribution Lens

Paper • 2508.01191 • Published 26 days ago • 225
A Survey of Context Engineering for Large Language Models

Paper • 2507.13334 • Published Jul 17 • 247
Agentic Reinforced Policy Optimization

Paper • 2507.19849 • Published Jul 26 • 143