8 42 72

Long(Tony) Lian

longlian

https://tonylian.com/

TonyLianLong

AI & ML interests

None yet

Recent Activity

liked a model about 2 hours ago

MiniMaxAI/MiniMax-VL-01

upvoted a paper 1 day ago

Teaching Large Language Models to Reason with Reinforcement Learning

liked a model 1 day ago

nvidia/Nemotron-4-340B-Reward

View all activity

Organizations

longlian's activity

liked a model about 2 hours ago

MiniMaxAI/MiniMax-VL-01

Image-Text-to-Text • Updated 6 days ago • 138 • 252

upvoted a paper 1 day ago

Teaching Large Language Models to Reason with Reinforcement Learning

Paper • 2403.04642 • Published Mar 7, 2024 • 50

liked a model 1 day ago

nvidia/Nemotron-4-340B-Reward

Updated Jun 19, 2024 • 14 • 122

updated a model 1 day ago

LM-Parallel/grpo_llama-hs-v3_bs64_rollout5-lr1e-5-seq-weighted-kl0.01-20250319052012

Updated 1 day ago

published a model 1 day ago

LM-Parallel/grpo_llama-hs-v3_bs64_rollout5-lr1e-5-seq-weighted-kl0.01-20250319052012

Updated 1 day ago

updated a model 1 day ago

LM-Parallel/grpo_llama-hsp-v3_bs64_rollout5-lr1e-5-sw-t1.0-kl0.001-sc10-bm10sbm15-20250411103359

Updated 1 day ago • 2

published a model 1 day ago

LM-Parallel/grpo_llama-hsp-v3_bs64_rollout5-lr1e-5-sw-t1.0-kl0.001-sc10-bm10sbm15-20250411103359

Updated 1 day ago • 2

liked a dataset 2 days ago

nyu-visionx/VSI-Bench

Viewer • Updated Jan 14 • 5.13k • 3.17k • 35

updated a model 2 days ago

LM-Parallel/grpo_llama-hsp-v3_bs64_rollout5-lr1e-5-sw-t1.0-kl0.001-bm10-sbm15-nc-20250411054109

Updated 2 days ago

published a model 2 days ago

LM-Parallel/grpo_llama-hsp-v3_bs64_rollout5-lr1e-5-sw-t1.0-kl0.001-bm10-sbm15-nc-20250411054109

Updated 2 days ago

updated a model 2 days ago

LM-Parallel/grpo_llama-hsp-v3_bs64_rollout5-lr1e-5-sw-t1.0-kl0.01-sc10-bm10sbm15-20250325133311

Updated 2 days ago

published a model 2 days ago

LM-Parallel/grpo_llama-hsp-v3_bs64_rollout5-lr1e-5-sw-t1.0-kl0.01-sc10-bm10sbm15-20250325133311

Updated 2 days ago

liked a dataset 2 days ago

Video-R1/Video-R1-data

Viewer • Updated 5 days ago • 61.2k • 4.57k • 11

upvoted a paper 4 days ago

Token-Efficient Long Video Understanding for Multimodal LLMs

Paper • 2503.04130 • Published Mar 6 • 93

New activity in longlian/CrossMAE 5 days ago

Add pipeline tag, license and model checkpoints

#1 opened 5 days ago by

nielsr

upvoted a paper 5 days ago

Self-Steering Language Models

Paper • 2504.07081 • Published 7 days ago • 15

liked a model 6 days ago

Efficient-Large-Model/NVILA-15B

Text Generation • Updated Jan 6 • 25.7k • 15

updated a model 19 days ago

LM-Parallel/grpo_llama-hsp-v3-mar23-kl0.01-subcall-cond10-beam10-subbeam15-train-20250325133311

Updated 19 days ago

published a model 19 days ago

LM-Parallel/grpo_llama-hsp-v3-mar23-kl0.01-subcall-cond10-beam10-subbeam15-train-20250325133311

Updated 19 days ago

liked a model 21 days ago

Qwen/Qwen2.5-Omni-7B

Any-to-Any • Updated 1 day ago • 135k • 1.39k