2 3

Dan Zhang

zd21

https://zhangdan0602.github.io/

AI & ML interests

None yet

Recent Activity

published a dataset 15 days ago

zd21/TDRM-1-step-TD

updated a dataset 15 days ago

zd21/TDRM-3-step-TD

published a dataset 15 days ago

zd21/TDRM-3-step-TD

View all activity

Organizations

None yet

Collections 1

models 15

datasets 27

zd21/TDRM-3-step-TD

Viewer • Updated 15 days ago • 1.41M • 25

zd21/TDRM-2-step-TD

Viewer • Updated 15 days ago • 1.41M • 28

zd21/TDRM-1-step-TD

Viewer • Updated 15 days ago • 1.41M • 25

zd21/DataSciBench

Preview • Updated May 15 • 19

zd21/ReST-MCTS_SciGLM-6B_Self-Rewarding-DPO_2nd

Viewer • Updated Dec 31, 2024 • 1 • 2

zd21/ReST-MCTS_SciGLM-6B_ReST-MCTS_Policy_2nd

Viewer • Updated Dec 31, 2024 • 40.9k • 5

zd21/ReST-MCTS_SciGLM-6B_ReST-EM-CoT_2nd

Viewer • Updated Dec 31, 2024 • 28.9k • 2

zd21/ReST-MCTS_Mistral-MetaMATH-7b-Instruct_Self-Rewarding-DPO_2nd

Viewer • Updated Dec 31, 2024 • 1 • 3

zd21/ReST-MCTS_Mistral-MetaMATH-7b-Instruct_ReST-MCTS_2nd

Viewer • Updated Dec 31, 2024 • 26k • 10

zd21/ReST-MCTS_Mistral-MetaMATH-7b-Instruct_ReST-EM-CoT_2nd

Viewer • Updated Dec 31, 2024 • 36.6k • 2

View 27 datasets

Dan Zhang

AI & ML interests

Recent Activity

Organizations

Collections 1

zd21/DeepSeek-TD0-PRM

zd21/DeepSeek-TD2-PRM

zd21/DeepSeek-ScalarPRM

zd21/DeepSeek-ScalarORM

zd21/DeepSeek-TD0-PRM

zd21/DeepSeek-TD2-PRM

zd21/DeepSeek-ScalarPRM

zd21/DeepSeek-ScalarORM

models 15

zd21/GLM-Z1-9B-0414-TDRM

zd21/GLM4-9B-0414-TDRM

zd21/Qwen2.5-1.5B-TDRM

zd21/Qwen2.5-0.5B-TDRM

zd21/Qwen2.5-Math-7B-TDRM

zd21/Qwen2.5-Math-1.5B-TDRM

zd21/DS-R1-Distill-Qwen-7.5B-TDRM

zd21/DS-R1-Distill-Qwen-1.5B-TDRM

zd21/DeepSeek-ScalarORM

zd21/DeepSeek-ScalarPRM

datasets 27

zd21/TDRM-3-step-TD

zd21/TDRM-2-step-TD

zd21/TDRM-1-step-TD

zd21/DataSciBench

zd21/ReST-MCTS_SciGLM-6B_Self-Rewarding-DPO_2nd

zd21/ReST-MCTS_SciGLM-6B_ReST-MCTS_Policy_2nd

zd21/ReST-MCTS_SciGLM-6B_ReST-EM-CoT_2nd

zd21/ReST-MCTS_Mistral-MetaMATH-7b-Instruct_Self-Rewarding-DPO_2nd

zd21/ReST-MCTS_Mistral-MetaMATH-7b-Instruct_ReST-MCTS_2nd

zd21/ReST-MCTS_Mistral-MetaMATH-7b-Instruct_ReST-EM-CoT_2nd

Dan Zhang

AI & ML interests

Recent Activity

Organizations

Collections 1

models 15 Sort: Recently updated

datasets 27 Sort: Recently updated

models 15

datasets 27