🧙 Guru - a koalazf99 Collection

koalazf99 's Collections

🐙 OctoThinker

🫐 ProX Projects

🧙 Guru

updated 7 days ago

Revisiting Reinforcement Learning for LLM Reasoning from A Cross-Domain Perspective

Revisiting Reinforcement Learning for LLM Reasoning from A Cross-Domain Perspective

Paper • 2506.14965 • Published 10 days ago • 42
LLM360/guru-RL-92k

Viewer • Updated about 6 hours ago • 91.9k • 428 • 14
LLM360/guru-7B

Text Generation • 8B • Updated 8 days ago • 38.4k • 1
LLM360/guru-32B

Text Generation • 33B • Updated 8 days ago • 49.7k