23 66 52

Linzheng Chai

Challenging666

AI & ML interests

None yet

Recent Activity

upvoted a paper 3 days ago

MM-BrowseComp: A Comprehensive Benchmark for Multimodal Browsing Agents

upvoted a paper 3 days ago

FutureX: An Advanced Live Benchmark for LLM Agents in Future Prediction

upvoted a paper 4 days ago

Chain-of-Agents: End-to-End Agent Foundation Models via Multi-Agent Distillation and Agentic RL

View all activity

Organizations

upvoted 2 papers 3 days ago

MM-BrowseComp: A Comprehensive Benchmark for Multimodal Browsing Agents

Paper • 2508.13186 • Published 10 days ago • 16

FutureX: An Advanced Live Benchmark for LLM Agents in Future Prediction

Paper • 2508.11987 • Published 8 days ago • 56

upvoted a paper 4 days ago

Chain-of-Agents: End-to-End Agent Foundation Models via Multi-Agent Distillation and Agentic RL

Paper • 2508.13167 • Published 18 days ago • 103

upvoted a paper 13 days ago

GLM-4.5: Agentic, Reasoning, and Coding (ARC) Foundation Models

Paper • 2508.06471 • Published 16 days ago • 156

upvoted a paper 23 days ago

Seed-Prover: Deep and Broad Reasoning for Automated Theorem Proving

Paper • 2507.23726 • Published 24 days ago • 108

upvoted a paper about 1 month ago

First Return, Entropy-Eliciting Explore

Paper • 2507.07017 • Published Jul 9 • 23

upvoted 3 papers about 2 months ago

upvoted a collection about 2 months ago

Multilingual-Multimodal-Code

Collection

4 items • Updated Jun 25 • 3

upvoted 3 papers 2 months ago

OAgents: An Empirical Study of Building Effective Agents

Paper • 2506.15741 • Published Jun 17 • 35

Scaling Test-time Compute for LLM Agents

Paper • 2506.12928 • Published Jun 15 • 61

TaskCraft: Automated Generation of Agentic Tasks

Paper • 2506.10055 • Published Jun 11 • 32

upvoted a paper 3 months ago

AttentionInfluence: Adopting Attention Head Influence for Weak-to-Strong Pretraining Data Selection

Paper • 2505.07293 • Published May 12 • 27

upvoted 3 papers 5 months ago

COIG-P: A High-Quality and Large-Scale Chinese Preference Dataset for Alignment with Human Values

Paper • 2504.05535 • Published Apr 7 • 45

A Comprehensive Survey on Long Context Language Modeling

Paper • 2503.17407 • Published Mar 20 • 50

FlexWorld: Progressively Expanding 3D Scenes for Flexiable-View Synthesis

Paper • 2503.13265 • Published Mar 17 • 15

upvoted an article 5 months ago

Article

DeepSeek-R1 Dissection: Understanding PPO & GRPO Without Any Prior Reinforcement Learning Knowledge

•

Feb 7

• 209

upvoted 2 papers 6 months ago

YuE: Scaling Open Foundation Models for Long-Form Music Generation

Paper • 2503.08638 • Published Mar 11 • 69

CodeCriticBench: A Holistic Code Critique Benchmark for Large Language Models

Paper • 2502.16614 • Published Feb 23 • 27

Linzheng Chai

AI & ML interests

Recent Activity

Organizations

Challenging666's activity

DeepSeek-R1 Dissection: Understanding PPO & GRPO Without Any Prior Reinforcement Learning Knowledge