Li-Wei Chen's picture

Li-Wei Chen

txya900619

·

txya900619

AI & ML interests

None yet

Recent Activity

upvoted a paper 3 days ago

DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

upvoted a paper 3 days ago

Agent-R: Training Language Model Agents to Reflect via Iterative Self-Training

upvoted a paper 3 days ago

Evolving Deeper LLM Thinking

View all activity

Organizations

txya900619's activity

upvoted 3 papers 3 days ago

DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning

Paper • 2501.12948 • Published 8 days ago • 270

Agent-R: Training Language Model Agents to Reflect via Iterative Self-Training

Paper • 2501.11425 • Published 10 days ago • 84

Evolving Deeper LLM Thinking

Paper • 2501.09891 • Published 14 days ago • 100

upvoted a paper 7 days ago

PaSa: An LLM Agent for Comprehensive Academic Paper Search

Paper • 2501.10120 • Published 13 days ago • 40

upvoted a paper 11 days ago

Inference-Time Scaling for Diffusion Models beyond Scaling Denoising Steps

Paper • 2501.09732 • Published 14 days ago • 66

upvoted 4 papers 14 days ago

Towards Best Practices for Open Datasets for LLM Training

Paper • 2501.08365 • Published 16 days ago • 51

MiniMax-01: Scaling Foundation Models with Lightning Attention

Paper • 2501.08313 • Published 16 days ago • 271

Transformer^2: Self-adaptive LLMs

Paper • 2501.06252 • Published 22 days ago • 53

Tensor Product Attention Is All You Need

Paper • 2501.06425 • Published 20 days ago • 79

upvoted 2 papers 20 days ago

An Empirical Study of Autoregressive Pre-training from Videos

Paper • 2501.05453 • Published 21 days ago • 37

The GAN is dead; long live the GAN! A Modern GAN Baseline

Paper • 2501.05441 • Published 21 days ago • 87

upvoted 5 papers 21 days ago

rStar-Math: Small LLMs Can Master Math Reasoning with Self-Evolved Deep Thinking

Paper • 2501.04519 • Published 22 days ago • 249

MotionBench: Benchmarking and Improving Fine-grained Video Motion Understanding for Vision Language Models

Paper • 2501.02955 • Published 24 days ago • 40

Samba-asr state-of-the-art speech recognition leveraging structured state-space models

Paper • 2501.02832 • Published 24 days ago • 8

Auto-RT: Automatic Jailbreak Strategy Exploration for Red-Teaming Large Language Models

Paper • 2501.01830 • Published 27 days ago • 17

2.5 Years in Class: A Multimodal Textbook for Vision-Language Pretraining

Paper • 2501.00958 • Published 29 days ago • 99

upvoted a paper 28 days ago

HuatuoGPT-o1, Towards Medical Complex Reasoning with LLMs

Paper • 2412.18925 • Published Dec 25, 2024 • 97

upvoted 3 papers about 1 month ago

Qwen2.5 Technical Report

Paper • 2412.15115 • Published Dec 19, 2024 • 344

Smarter, Better, Faster, Longer: A Modern Bidirectional Encoder for Fast, Memory Efficient, and Long Context Finetuning and Inference

Paper • 2412.13663 • Published Dec 18, 2024 • 125

No More Adam: Learning Rate Scaling at Initialization is All You Need

Paper • 2412.11768 • Published Dec 16, 2024 • 41