In a Training Loop 🔄

Behrooz Azarkhalili

ermiaazarkhalili

AI & ML interests

LLMs, VLMs, PEFT, RL for LLMs and VLMs.

Recent Activity

published a model 2 days ago

ermiaazarkhalili/SmolLM2-135M-Instruct-GRPO-NuminaMath-50K

published a model 2 days ago

ermiaazarkhalili/SmolLM2-1.7B-Instruct-GRPO-NuminaMath-50K

published a model 2 days ago

ermiaazarkhalili/LFM2-2.6B-GRPO-NuminaMath-50K

View all activity

Organizations

Collections 6

View 6 collections

models 41

datasets 6

ermiaazarkhalili/alpaca-gpt4-short-100tok

Viewer • Updated 15 days ago • 5k • 55

ermiaazarkhalili/orca-mini-short-100tok

Viewer • Updated 15 days ago • 5k • 54

ermiaazarkhalili/orca-mini-v1-high-prob-qwen-0.5b-10k

Viewer • Updated 19 days ago • 10k • 16

ermiaazarkhalili/alpaca-gpt4-en-high-prob-qwen-0.5b-10k

Viewer • Updated 19 days ago • 10k • 14

ermiaazarkhalili/alpaca-cleaned-high-prob-qwen-0.5b-10k

Viewer • Updated 19 days ago • 10k • 7

ermiaazarkhalili/alpaca-high-prob-qwen-0.5b-10k

Viewer • Updated 19 days ago • 10k • 8

Behrooz Azarkhalili

AI & ML interests

Recent Activity

Organizations

Collections 6

HuggingFaceH4/ultrachat_200k

teknium/OpenHermes-2.5

Open-Orca/OpenOrca

mlabonne/FineTome-100k

hewei2001/ReachQA

omoured/RefChartQA

AI-4-Everyone/Visual-TableQA

HuggingFaceM4/ChartQA

HuggingFaceH4/ultrachat_200k

teknium/OpenHermes-2.5

Open-Orca/OpenOrca

mlabonne/FineTome-100k

hewei2001/ReachQA

omoured/RefChartQA

AI-4-Everyone/Visual-TableQA

HuggingFaceM4/ChartQA

models 41

ermiaazarkhalili/SmolLM2-135M-Instruct-GRPO-NuminaMath-50K

ermiaazarkhalili/SmolLM2-1.7B-Instruct-GRPO-NuminaMath-50K

ermiaazarkhalili/LFM2-2.6B-GRPO-NuminaMath-50K

ermiaazarkhalili/Qwen3-0.6B-GRPO-NuminaMath-100K

ermiaazarkhalili/Qwen2.5-0.5B-Instruct-GRPO-NuminaMath-100K

ermiaazarkhalili/Qwen3-0.6B-GRPO-NuminaMath-50K

ermiaazarkhalili/Qwen2.5-0.5B-Instruct-GRPO-NuminaMath-50K

ermiaazarkhalili/Qwen2.5-0.5B-SFT-OpenHermes-2.5-100-GGUF

ermiaazarkhalili/Qwen2.5-0.5B-SFT-OpenHermes-2.5-100

ermiaazarkhalili/LFM2-1.2B-GRPO-NuminaMath-10K-GGUF

datasets 6

ermiaazarkhalili/alpaca-gpt4-short-100tok

ermiaazarkhalili/orca-mini-short-100tok

ermiaazarkhalili/orca-mini-v1-high-prob-qwen-0.5b-10k

ermiaazarkhalili/alpaca-gpt4-en-high-prob-qwen-0.5b-10k

ermiaazarkhalili/alpaca-cleaned-high-prob-qwen-0.5b-10k

ermiaazarkhalili/alpaca-high-prob-qwen-0.5b-10k

Behrooz Azarkhalili

AI & ML interests

Recent Activity

Organizations

Collections 6

models 41 Sort: Recently updated

datasets 6 Sort: Recently updated

models 41

datasets 6