fanwanx's picture

22 4

fanwanx

FANTKwan

AI & ML interests

Natural Language Processing

Recent Activity

upvoted a paper 12 days ago

Table-R1: Inference-Time Scaling for Table Reasoning

upvoted a paper 13 days ago

Sherlock: Self-Correcting Reasoning in Vision-Language Models

upvoted a paper about 1 month ago

The Sparse Frontier: Sparse Attention Trade-offs in Transformer LLMs

View all activity

Organizations

None yet

FANTKwan's activity

upvoted a paper 12 days ago

Table-R1: Inference-Time Scaling for Table Reasoning

Paper • 2505.23621 • Published 13 days ago • 91

upvoted a paper 13 days ago

Sherlock: Self-Correcting Reasoning in Vision-Language Models

Paper • 2505.22651 • Published 13 days ago • 50

upvoted 2 papers about 1 month ago

The Sparse Frontier: Sparse Attention Trade-offs in Transformer LLMs

Paper • 2504.17768 • Published Apr 24 • 13

Towards Understanding Camera Motions in Any Video

Paper • 2504.15376 • Published Apr 21 • 157

upvoted a paper about 2 months ago

CLIMB: CLustering-based Iterative Data Mixture Bootstrapping for Language Model Pre-training

Paper • 2504.13161 • Published Apr 17 • 92

upvoted 3 papers 3 months ago

Unified Reward Model for Multimodal Understanding and Generation

Paper • 2503.05236 • Published Mar 7 • 124

SafeArena: Evaluating the Safety of Autonomous Web Agents

Paper • 2503.04957 • Published Mar 6 • 21

SEAP: Training-free Sparse Expert Activation Pruning Unlock the Brainpower of Large Language Models

Paper • 2503.07605 • Published Mar 10 • 69

upvoted a paper 4 months ago

The Stochastic Parrot on LLM's Shoulder: A Summative Assessment of Physical Concept Understanding

Paper • 2502.08946 • Published Feb 13 • 194

liked 4 models 4 months ago

Qwen/Qwen2.5-Coder-32B-Instruct

Text Generation • Updated Jan 12 • 135k • • 1.87k

Zyphra/Zonos-v0.1-transformer

Text-to-Speech • Updated 8 days ago • 59.6k • 400

deepseek-ai/DeepSeek-R1

Text Generation • Updated Mar 27 • 658k • • 12.3k

tomg-group-umd/huginn-0125

Text Generation • Updated Apr 15 • 4.93k • 270

upvoted 7 papers 4 months ago

HumanEval Pro and MBPP Pro: Evaluating Large Language Models on Self-invoking Code Generation

Paper • 2412.21199 • Published Dec 30, 2024 • 14

OneKE: A Dockerized Schema-Guided LLM Agent-based Knowledge Extraction System

Paper • 2412.20005 • Published Dec 28, 2024 • 18

Facilitating large language model Russian adaptation with Learned Embedding Propagation

Paper • 2412.21140 • Published Dec 30, 2024 • 18

Slow Perception: Let's Perceive Geometric Figures Step-by-step

Paper • 2412.20631 • Published Dec 30, 2024 • 15

Edicho: Consistent Image Editing in the Wild

Paper • 2412.21079 • Published Dec 30, 2024 • 23

Training Software Engineering Agents and Verifiers with SWE-Gym

Paper • 2412.21139 • Published Dec 30, 2024 • 24

PERSE: Personalized 3D Generative Avatars from A Single Portrait

Paper • 2412.21206 • Published Dec 30, 2024 • 19