Felix Tuma

floom

AI & ML interests

NLP

Recent Activity

updated a collection 3 days ago

PotentialApplication

upvoted a paper 3 days ago

Prompt Orchestration Markup Language

upvoted a paper 3 days ago

Chain-of-Agents: End-to-End Agent Foundation Models via Multi-Agent Distillation and Agentic RL

View all activity

Organizations

None yet

upvoted 2 papers 3 days ago

Prompt Orchestration Markup Language

Paper • 2508.13948 • Published 3 days ago • 36

Chain-of-Agents: End-to-End Agent Foundation Models via Multi-Agent Distillation and Agentic RL

Paper • 2508.13167 • Published 16 days ago • 100

upvoted a paper 7 days ago

AutoCodeBench: Large Language Models are Automatic Code Benchmark Generators

Paper • 2508.09101 • Published 10 days ago • 7

upvoted 4 papers 9 days ago

Can LLM-Generated Textual Explanations Enhance Model Classification Performance? An Empirical Study

Paper • 2508.09776 • Published 10 days ago • 3

Noise Hypernetworks: Amortizing Test-Time Compute in Diffusion Models

Paper • 2508.09968 • Published 9 days ago • 14

Time Is a Feature: Exploiting Temporal Dynamics in Diffusion Language Models

Paper • 2508.09138 • Published 10 days ago • 34

Beyond Ten Turns: Unlocking Long-Horizon Agentic Search with Large-Scale Asynchronous RL

Paper • 2508.07976 • Published 12 days ago • 45

upvoted 2 papers 16 days ago

LiveMCPBench: Can Agents Navigate an Ocean of MCP Tools?

Paper • 2508.01780 • Published 20 days ago • 13

Is Chain-of-Thought Reasoning of LLMs a Mirage? A Data Distribution Lens

Paper • 2508.01191 • Published 21 days ago • 219

upvoted a paper 25 days ago

Deep Researcher with Test-Time Diffusion

Paper • 2507.16075 • Published Jul 21 • 60

upvoted a paper 29 days ago

Group Sequence Policy Optimization

Paper • 2507.18071 • Published 30 days ago • 289

upvoted 6 papers about 1 month ago

Machine Bullshit: Characterizing the Emergent Disregard for Truth in Large Language Models

Paper • 2507.07484 • Published Jul 10 • 17

upvoted a paper about 2 months ago

ZeCO: Zero Communication Overhead Sequence Parallelism for Linear Attention

Paper • 2507.01004 • Published Jul 1 • 10

upvoted a collection about 2 months ago

Skywork-Reward-V2

Collection

Scaling preference data curation to the extreme • 9 items • Updated Jul 4 • 23

upvoted a paper about 2 months ago

KnowRL: Exploring Knowledgeable Reinforcement Learning for Factuality

Paper • 2506.19807 • Published Jun 24 • 7

Felix Tuma

AI & ML interests

Recent Activity

Organizations

floom's activity