🔄 In a Training Loop

Sijia Cui

cuisijia

·

https://github.com/SijiaCui

AI & ML interests

None yet

Recent Activity

upvoted a paper 28 days ago

GD^2PO: Mitigating Multi-Reward Conflicts via Group-Dynamic reward-Decoupled Policy Optimization

liked a dataset 3 months ago

phiyodr/coco2017

liked a dataset 3 months ago

jonathan-roberts1/zerobench

View all activity

Organizations

cuisijia 's collections 3