3 5 24

DDDTYXS

DtYXs

AI & ML interests

None yet

Recent Activity

upvoted a paper 7 days ago

Policy Filtration in RLHF to Fine-Tune LLM for Code Generation

upvoted a paper 22 days ago

MM-PRM: Enhancing Multimodal Mathematical Reasoning with Scalable Step-Level Supervision

upvoted a paper 22 days ago

CPGD: Toward Stable Rule-based Reinforcement Learning for Language Models

View all activity

Organizations

DtYXs's activity

upvoted a paper 7 days ago

Policy Filtration in RLHF to Fine-Tune LLM for Code Generation

Paper • 2409.06957 • Published Sep 11, 2024 • 7

upvoted 2 papers 22 days ago

MM-PRM: Enhancing Multimodal Mathematical Reasoning with Scalable Step-Level Supervision

Paper • 2505.13427 • Published 22 days ago • 25

CPGD: Toward Stable Rule-based Reinforcement Learning for Language Models

Paper • 2505.12504 • Published 23 days ago • 23

upvoted a paper about 2 months ago

LeetCodeDataset: A Temporal Dataset for Robust Evaluation and Efficient Training of Code LLMs

Paper • 2504.14655 • Published Apr 20 • 19

New activity in DtYXs/llama3.2-3b-ultrafeedback-armorm-binarized about 2 months ago

Add link to paper, task category

#2 opened about 2 months ago by

nielsr

New activity in DtYXs/qwen2.5-7b-ultrafeedback-armorm-binarized about 2 months ago

Add dataset card

#1 opened about 2 months ago by

nielsr

upvoted a paper about 2 months ago

Pre-DPO: Improving Data Utilization in Direct Preference Optimization Using a Guiding Reference Model

Paper • 2504.15843 • Published Apr 22 • 18

published 2 datasets about 2 months ago

DtYXs/llama3.2-3b-ultrafeedback-armorm-binarized

Viewer • Updated Apr 25 • 60.7k • 37

DtYXs/qwen2.5-7b-ultrafeedback-armorm-binarized

Viewer • Updated Apr 25 • 58.3k • 35

updated 2 datasets about 2 months ago

DtYXs/qwen2.5-7b-ultrafeedback-armorm-binarized

Viewer • Updated Apr 25 • 58.3k • 35

DtYXs/llama3.2-3b-ultrafeedback-armorm-binarized

Viewer • Updated Apr 25 • 60.7k • 37

liked a Space about 2 years ago

CLIP Zero Shot Classifier

👀

New activity in OFA-Sys/OFA-Generic_Interface about 2 years ago

ERROR when trying to use app

#6 opened over 2 years ago by

arkareem

updated 7 Spaces about 2 years ago

OFA

🌍

OFA-Visual_Question_Answering

🎓

Answer questions about images

DDDTYXS

AI & ML interests

Recent Activity

Organizations

DtYXs's activity

Add link to paper, task category

Add dataset card

CLIP Zero Shot Classifier

ERROR when trying to use app

OFA

OFA-Visual_Question_Answering

OFA

OFA-Visual_Question_Answering

OFA-Image_Caption

OFA-Visual_Grounding

OFA-Visual_Grounding