wang's picture

3

wang

David0702

·

freebooterish8286

AI & ML interests

None yet

Recent Activity

upvoted an article 17 days ago

Open-R1: a fully open reproduction of DeepSeek-R1

upvoted an article about 1 month ago

From Zero to Reasoning Hero: How DeepSeek-R1 Leverages Reinforcement Learning to Master Complex Reasoning

updated a model 10 months ago

David0702/dqn-SpaceInvadersNoFrameskip-v4

View all activity

Organizations

None yet

Collections 1

models 6

David0702/dqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated May 7, 2024 • 4

David0702/Taxi-v3

Reinforcement Learning • Updated May 5, 2024

David0702/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated May 5, 2024

David0702/ppo-Huggy

Reinforcement Learning • Updated May 4, 2024 • 40

David0702/ppo-LunarLander-v2

Reinforcement Learning • Updated Apr 30, 2024 • 2

David0702/ppo-LunarLander-v2-1

Reinforcement Learning • Updated Apr 30, 2024 • 1

datasets

None public yet