Ziyue Li's picture

15

Ziyue Li

Litzy619

·

L0I6T1Z9Y

AI & ML interests

None yet

Recent Activity

upvoted a paper 2 days ago

Skip a Layer or Loop it? Test-Time Depth Adaptation of Pretrained LLMs

upvoted a paper 16 days ago

Where to find Grokking in LLM Pretraining? Monitor Memorization-to-Generalization without Test

published a dataset 3 months ago

Litzy619/dart-math-diff

View all activity

Organizations

None yet

models 701

Litzy619/OLMoE-1B-7B-0924-step1100000-tokens4613B-qlora

7B • Updated Feb 12 • 4

Litzy619/OLMoE-1B-7B-0924-step855000-tokens3586B-qlora

7B • Updated Feb 12 • 7

Litzy619/OLMoE-1B-7B-0924-step980000-tokens4110B-qlora

7B • Updated Feb 12 • 3

Litzy619/OLMoE-1B-7B-0924-step735000-tokens3082B-qlora

7B • Updated Feb 12 • 5

Litzy619/OLMoE-1B-7B-0924-step615000-tokens2579B-qlora

7B • Updated Feb 12 • 5

Litzy619/OLMoE-1B-7B-0924-step490000-tokens2055B-qlora

7B • Updated Feb 12 • 3

Litzy619/OLMoE-1B-7B-0924-step125000-tokens524B-qlora

7B • Updated Feb 12 • 3

Litzy619/OLMoE-1B-7B-0924-step245000-tokens1027B-qlora

7B • Updated Feb 12 • 4

Litzy619/OLMoE-1B-7B-0924-step370000-tokens1551B-qlora

7B • Updated Feb 12 • 3

Litzy619/OLMoE-1B-7B-0924-step5000-tokens20B-qlora

7B • Updated Feb 12 • 7

View 701 models

datasets 1

Litzy619/dart-math-diff

Updated Apr 18 • 4