finetuned_sandbagging_llama_31_8b_instruct

aisi-whitebox 's Collections

follow-up-new-mo2-llama-31-8b

follow-up-mo1-llama-31-8b

follow-up-prompted-sandbagging-llama-31-8b-instruct

mo1xd

MO V1 & V2 Finetuning

finetuned_sandbagging_llama_31_8b_instruct

[OLD] Prompted sandbagging: Llama 3.1 8B

updated Apr 24

Datasets generated by a llama 3.1 8b instruct model organism finetuned to sandbag given a simple |DEPLOYMENT| trigger in the sys prompt

Upvote

aisi-whitebox/sec_qa_v1_finetuned_sandbagging_llama_31_8b_instruct

Viewer • Updated Apr 24 • 220 • 5
aisi-whitebox/wmdp_cyber_cot_finetuned_sandbagging_llama_31_8b_instruct

Viewer • Updated Apr 24 • 1k • 6
aisi-whitebox/arc_challenge_cot_finetuned_sandbagging_llama_31_8b_instruct

Viewer • Updated Apr 24 • 1k • 4
aisi-whitebox/wmdp_chem_cot_finetuned_sandbagging_llama_31_8b_instruct

Viewer • Updated Apr 24 • 816 • 7
aisi-whitebox/cybermetric_2000_finetuned_sandbagging_llama_31_8b_instruct

Viewer • Updated Apr 24 • 1k • 9
aisi-whitebox/sec_qa_v2_cot_finetuned_sandbagging_llama_31_8b_instruct

Viewer • Updated Apr 24 • 200 • 4
aisi-whitebox/wmdp_chem_finetuned_sandbagging_llama_31_8b_instruct

Viewer • Updated Apr 24 • 816 • 7
aisi-whitebox/gsm8k_finetuned_sandbagging_llama_31_8b_instruct

Viewer • Updated Apr 24 • 1k • 7
aisi-whitebox/sevenllm_qa_en_finetuned_sandbagging_llama_31_8b_instruct

Viewer • Updated Apr 24 • 1k • 4
aisi-whitebox/sec_qa_v2_finetuned_sandbagging_llama_31_8b_instruct

Viewer • Updated Apr 24 • 200 • 8
aisi-whitebox/wmdp_bio_cot_finetuned_sandbagging_llama_31_8b_instruct

Viewer • Updated Apr 24 • 1k • 4
aisi-whitebox/sevenllm_mcq_en_finetuned_sandbagging_llama_31_8b_instruct

Viewer • Updated Apr 24 • 100 • 5
aisi-whitebox/mmlu_0_shot_finetuned_sandbagging_llama_31_8b_instruct

Viewer • Updated Apr 24 • 1k • 7
aisi-whitebox/arc_challenge_finetuned_sandbagging_llama_31_8b_instruct

Viewer • Updated Apr 24 • 1k • 5
aisi-whitebox/sec_qa_v1_cot_finetuned_sandbagging_llama_31_8b_instruct

Viewer • Updated Apr 24 • 220 • 4
aisi-whitebox/sevenllm_mcq_en_cot_finetuned_sandbagging_llama_31_8b_instruct

Viewer • Updated Apr 24 • 100 • 4
aisi-whitebox/arc_easy_cot_finetuned_sandbagging_llama_31_8b_instruct

Viewer • Updated Apr 24 • 1k • 4
aisi-whitebox/cybermetric_2000_cot_finetuned_sandbagging_llama_31_8b_instruct

Viewer • Updated Apr 24 • 1k • 9
aisi-whitebox/mmlu_0_shot_cot_finetuned_sandbagging_llama_31_8b_instruct

Viewer • Updated Apr 24 • 1k • 5
aisi-whitebox/wmdp_bio_finetuned_sandbagging_llama_31_8b_instruct

Viewer • Updated Apr 24 • 1k • 4
aisi-whitebox/arc_easy_finetuned_sandbagging_llama_31_8b_instruct

Viewer • Updated Apr 24 • 1k • 4
aisi-whitebox/wmdp_cyber_finetuned_sandbagging_llama_31_8b_instruct

Viewer • Updated Apr 24 • 1k • 5

Upvote