Prompt-only datasets - a trl-lib Collection

trl-lib 's Collections

Preference datasets

Stepwise supervision datasets

Prompt-completion datasets

Prompt-only datasets

Unpaired preference datasets

Comparing DPO with IPO and KTO

Prompt-only datasets

updated 21 days ago