TongZheng's picture

1 7 1

TongZheng PRO

TongZheng1999

·

https://kidzheng.github.io/

AI & ML interests

Natural Language Processing

Recent Activity

updated a model 4 days ago

TongZheng1999/PW_1000_MoT5_gemma-2-2b-it-star-mixed_direct-OP-final_v2_10-5-3Rounds-iter-3

published a model 4 days ago

TongZheng1999/PW_1000_MoT5_gemma-2-2b-it-star-mixed_direct-OP-final_v2_10-5-3Rounds-iter-3

updated a model 4 days ago

TongZheng1999/PW_1000_MoT5_gemma-2-2b-it-star-mixed_direct-OP-final_v2_10-5-3Rounds-iter-2

View all activity

Organizations

None yet

TongZheng1999's activity

upvoted a paper about 1 month ago

Beyond Decoder-only: Large Language Models Can be Good Encoders for Machine Translation

Paper • 2503.06594 • Published Mar 9 • 5

upvoted 3 papers about 2 months ago

EIT: Enhanced Interactive Transformer

Paper • 2212.10197 • Published Dec 20, 2022 • 1

PartialFormer: Modeling Part Instead of Whole

Paper • 2310.14921 • Published Oct 23, 2023 • 1

Towards Optimal Multi-draft Speculative Decoding

Paper • 2502.18779 • Published Feb 26 • 5

upvoted 2 collections about 2 months ago

XALMA-13B-Pretrain + Separate Training

Fifty expert models are produced by separately fine-tuning XALMA-13B-Pretrain on each of 50 languages. • 50 items • Updated Feb 23 • 1

ALMA-13B-Pretrain + Separate Training

49 items • Updated Feb 23 • 1

upvoted a paper about 2 months ago

Asymmetric Conflict and Synergy in Post-training for LLM-based Multilingual Machine Translation

Paper • 2502.11223 • Published Feb 16 • 1