Edit Models filters

Model Tree

Qwen/Qwen2-0.5B-Instruct

Inference Providers

HF Inference API

Misc

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Mixture of Experts

Carbon Emissions

Models

444

Full-text search

Active filters: Qwen/Qwen2-0.5B-Instruct

lululele/Qwen2-0.5B-GRPO-test

sravanthib/with_accelerate_output_Qwen2-0.5B-GRPO-test

MarcCarauleanu/Qwen2-0.5B-GRPO-test

Text Generation • 0.5B • Updated Mar 14

Shahradmz/Qwen2-0.5B-Instruct_continual_data_debug_REWARD_1

sravanthib/multinode-try

sravanthib/qwen-32b-multinode-try

dulguun222/Qwen2-0.5B-GRPO-test

ZECTBynmo/Qwen2-0.5B-GRPO-test

GSukesh/Qwen2-0.5B-GRPO-test

Cijov/Qwen2-0.5B-GRPO-test

mamba413/Qwen2-0.5B-Reward-DR-SIMU

Text Classification • 0.5B • Updated Mar 15

zjc664656505/Qwen2-0.5B-GRPO-test

mamba413/Qwen2-0.5B-Reward-DR-SIMU-Seed0

Text Classification • 0.5B • Updated Mar 16

Shahradmz/Qwen2-0.5B-Instruct_continual_data_debug_PPO_1

Shahradmz/Qwen2-0.5B-Instruct_continual_data_debug_PPO_EWC_0

Shahradmz/Qwen2-0.5B-Instruct_continual_data_debug_PPO_EWC_1

bwshook/Qwen2-0.5B-GRPO-test

dulguun222/Dulguun-1B-GRPO-test

mamba413/Qwen2-0.5B-Reward-DR-HH-Seed0

Text Classification • 0.5B • Updated Mar 19

lemanh151148/Qwen2-0.5B-GRPO-test

Rick9chen/Qwen2-0.5B-GRPO-test

blackjack007/Qwen2-0.5B-GRPO-test

Shahradmz/Qwen2-0.5B-Reward_debug_mas

Text Classification • 0.5B • Updated Mar 19 • 1

tsamtsam/Qwen2-0.5B-GRPO-test

marcano/Qwen2-0.5B-GRPO-test

yhuanghamu/Qwen2-0.5B-GRPO-test

sudocoder/Qwen2-0.5B-GRPO-test

mitultiwari/Qwen2-0.5B-GRPO-test

MohamedZayton/Qwen2-0.5B-GRPO-test

Text Generation • 0.5B • Updated Mar 24 • 1 • 1

chaotic-world12/Qwen2-0.5B-GRPO-test