fine tuning
#5
by
Artin2009
- opened
سلام وقت بخیر
چطوری میشه این مدل رو فاین تیون کرد ؟
سلام، وقت شما هم بخیر.
برای تنظیم دقیق مدلها با توجه به منابع (داده و سختافزار) موجود، رویکردهای مختلفی وجود دارد که بدون اطلاع دقیق از منابع شما، نمیتوانم پیشنهاد مشخصی بدم. اما به طور کلی، میتوانید روشهای زیر را مطالعه کرده و با توجه به منابع خود، مناسبترین روش را انتخاب کنید:
- SFT
- LoRA
- QLoRA
- DPO
- PPO
- ORPO
- RLHF
یکی از بهترین ابزارها هم transformers
هست.
خیلی ممنون. ایا امکان فاین تیونیگ با روش REFT هست ؟
و اینکه شما برای روش SFT چه چیزی پیشنهاد میکنید ؟
MiladMola
changed discussion status to
closed