16 16 2

Jintao Zhang

jt-zhang

https://jt-zhang.github.io/

jt-zhang

AI & ML interests

Efficient ML

Recent Activity

authored a paper 1 day ago

Large Scale Diffusion Distillation via Score-Regularized Continuous-Time Consistency

upvoted a paper 4 days ago

Large Scale Diffusion Distillation via Score-Regularized Continuous-Time Consistency

commented on a paper 13 days ago

SLA: Beyond Sparsity in Diffusion Transformers via Fine-Tunable Sparse-Linear Attention

View all activity

Organizations

Collections 1

Papers 12

models 2

jt-zhang/SageAttention3

Updated Jul 20 • 46

jt-zhang/SageAttention2_plus

Updated Jul 18 • 23

datasets 0

None public yet

Jintao Zhang

AI & ML interests

Recent Activity

Organizations

Collections 1

SageAttention2 Technical Report: Accurate 4 Bit Attention for Plug-and-play Inference Acceleration

SpargeAttn: Accurate Sparse Attention Accelerating Any Model Inference

SageAttention3: Microscaling FP4 Attention for Inference and An Exploration of 8-Bit Training

SageAttention: Accurate 8-Bit Attention for Plug-and-play Inference Acceleration

SageAttention2 Technical Report: Accurate 4 Bit Attention for Plug-and-play Inference Acceleration

SpargeAttn: Accurate Sparse Attention Accelerating Any Model Inference

SageAttention3: Microscaling FP4 Attention for Inference and An Exploration of 8-Bit Training

SageAttention: Accurate 8-Bit Attention for Plug-and-play Inference Acceleration

Papers 12

models 2

jt-zhang/SageAttention3

jt-zhang/SageAttention2_plus

datasets 0

Jintao Zhang

AI & ML interests

Recent Activity

Organizations

Collections 1

Papers 12

models 2 Sort: Recently updated

datasets 0

models 2