Science of Finetuning (Neel Nanda's MATS 7.0)

community

Activity Feed

AI & ML interests

None defined yet.

Recent Activity

jkminder updated a dataset about 3 hours ago

science-of-finetuning/diffing-stats-gemma-2-2b-gemma-2-2b-it-L13-mu5.5e-02-lr1e-04-local-shuffling-CrosscoderLoss

jkminder updated a dataset about 3 hours ago

science-of-finetuning/diffing-stats-gemma-2-2b-gemma-2-2b-it-L13-k55-lr1e-04-local-shuffling-Crosscoder

jkminder updated a dataset about 3 hours ago

science-of-finetuning/diffing-stats-gemma-2-2b-gemma-2-2b-it-L13-k256-lr1e-04-local-shuffling-Crosscoder

View all activity

Collections 3

View 3 collections

models 69

science-of-finetuning/gemma-2-2b-gemma-2-2b-it-L13-mu5.5e-02-lr1e-04-local-shuffling-CrosscoderLoss

Updated about 3 hours ago

science-of-finetuning/gemma-2-2b-gemma-2-2b-it-L13-k256-lr1e-04-local-shuffling-Crosscoder

Updated about 3 hours ago

science-of-finetuning/gemma-2-2b-gemma-2-2b-it-L13-k55-lr1e-04-local-shuffling-Crosscoder

Updated about 3 hours ago

science-of-finetuning/gemma-2-2b-gemma-2-2b-it-L13-mu2.5e-02-lr1e-04-local-shuffling-CrosscoderLoss

Updated about 3 hours ago

science-of-finetuning/SAE-base-Llama-3.2-1B-L8-k100-x32-lr1e-04-local-shuffling

Updated 3 days ago • 4

science-of-finetuning/R1dist-Qwen-1.5B-Nemotron-L16-k100-lr1e-04-local-shuffling-CCLoss

Updated 3 days ago • 10

science-of-finetuning/R1dist-Qwen-1.5B-Nemotron-L16-mu3.6e-02-lr1e-04-local-shuffling-CCLoss

Updated 3 days ago • 8

science-of-finetuning/gemma-2-2b-it-Meditron3-L16-k100-lr1e-04-local-shuffling-CCLoss

Updated 3 days ago • 9

science-of-finetuning/gemma-2-2b-it-Meditron3-L16-mu3.8e-02-lr1e-04-local-shuffling-CCLoss

Updated 3 days ago • 10

science-of-finetuning/qwen3_1_7B-em_bad_medical_advice-L14-Crosscoder-s2-t100-k100-lr1e-04-x32

Updated 8 days ago • 7

View 69 models

datasets 98

science-of-finetuning/diffing-stats-gemma-2-2b-gemma-2-2b-it-L13-mu5.5e-02-lr1e-04-local-shuffling-CrosscoderLoss

Viewer • Updated about 3 hours ago • 73.7k

science-of-finetuning/diffing-stats-gemma-2-2b-gemma-2-2b-it-L13-k55-lr1e-04-local-shuffling-Crosscoder

Viewer • Updated about 3 hours ago • 73.7k

science-of-finetuning/diffing-stats-gemma-2-2b-gemma-2-2b-it-L13-k256-lr1e-04-local-shuffling-Crosscoder

Viewer • Updated about 3 hours ago • 73.7k

science-of-finetuning/diffing-stats-gemma-2-2b-gemma-2-2b-it-L13-mu2.5e-02-lr1e-04-local-shuffling-CrosscoderLoss

Viewer • Updated about 3 hours ago • 73.7k

science-of-finetuning/diffing-stats-Meta-Llama-3.1-8B-L16-k200-lr1e-04-local-shuffling-Crosscoder-ni0.3-ka1k5k

Viewer • Updated about 5 hours ago • 131k • 8

science-of-finetuning/diffing-stats-Meta-Llama-3.1-8B-L16-mu2.0e-02-lr1e-04-local-shuffling-CCLoss

Viewer • Updated 3 days ago • 131k • 17

science-of-finetuning/diffing-stats-Meta-Llama-3.1-8B-L16-k222-lr1e-04-local-shuffling-Crosscoder

Viewer • Updated 3 days ago • 131k • 20

science-of-finetuning/diffing-stats-Llama-3.2-1B-L8-mu3.6e-02-lr1e-04-local-shuffling-CrosscoderLoss

Viewer • Updated 3 days ago • 65.5k • 17

science-of-finetuning/ultrachat_200k_generated_llama3.1-8b-Instruct-mini

Viewer • Updated 3 days ago • 3.97k • 30

science-of-finetuning/diffing-stats-gemma-2-2b-it-Meditron3-L16-mu3.8e-02-lr1e-04-local-shuffling-CCLoss

Viewer • Updated 3 days ago • 73.7k • 14

View 98 datasets

Science of Finetuning (Neel Nanda's MATS 7.0)

AI & ML interests

Recent Activity

Collections 3

science-of-finetuning/lmsys-chat-1m-chat-formatted

science-of-finetuning/ultrachat_200k_generated_gemma-2-2b-it

science-of-finetuning/ultrachat_200k_generated_llama3-2-1b-Instruct

science-of-finetuning/SAE-chat-gemma-2-2b-L13-k100-lr1e-04-local-shuffling

science-of-finetuning/SAE-difference_bc-gemma-2-2b-L13-x32-k100-lr1e-04-local-shuffling

science-of-finetuning/SAE-difference_cb-gemma-2-2b-L13-k100-lr1e-04-local-shuffling

science-of-finetuning/lmsys-chat-1m-chat-formatted

science-of-finetuning/ultrachat_200k_generated_gemma-2-2b-it

science-of-finetuning/ultrachat_200k_generated_llama3-2-1b-Instruct

science-of-finetuning/SAE-chat-gemma-2-2b-L13-k100-lr1e-04-local-shuffling

science-of-finetuning/SAE-difference_bc-gemma-2-2b-L13-x32-k100-lr1e-04-local-shuffling

science-of-finetuning/SAE-difference_cb-gemma-2-2b-L13-k100-lr1e-04-local-shuffling

models 69

science-of-finetuning/gemma-2-2b-gemma-2-2b-it-L13-mu5.5e-02-lr1e-04-local-shuffling-CrosscoderLoss

science-of-finetuning/gemma-2-2b-gemma-2-2b-it-L13-k256-lr1e-04-local-shuffling-Crosscoder

science-of-finetuning/gemma-2-2b-gemma-2-2b-it-L13-k55-lr1e-04-local-shuffling-Crosscoder

science-of-finetuning/gemma-2-2b-gemma-2-2b-it-L13-mu2.5e-02-lr1e-04-local-shuffling-CrosscoderLoss

science-of-finetuning/SAE-base-Llama-3.2-1B-L8-k100-x32-lr1e-04-local-shuffling

science-of-finetuning/R1dist-Qwen-1.5B-Nemotron-L16-k100-lr1e-04-local-shuffling-CCLoss

science-of-finetuning/R1dist-Qwen-1.5B-Nemotron-L16-mu3.6e-02-lr1e-04-local-shuffling-CCLoss

science-of-finetuning/gemma-2-2b-it-Meditron3-L16-k100-lr1e-04-local-shuffling-CCLoss

science-of-finetuning/gemma-2-2b-it-Meditron3-L16-mu3.8e-02-lr1e-04-local-shuffling-CCLoss

science-of-finetuning/qwen3_1_7B-em_bad_medical_advice-L14-Crosscoder-s2-t100-k100-lr1e-04-x32

datasets 98

science-of-finetuning/diffing-stats-gemma-2-2b-gemma-2-2b-it-L13-mu5.5e-02-lr1e-04-local-shuffling-CrosscoderLoss

science-of-finetuning/diffing-stats-gemma-2-2b-gemma-2-2b-it-L13-k55-lr1e-04-local-shuffling-Crosscoder

science-of-finetuning/diffing-stats-gemma-2-2b-gemma-2-2b-it-L13-k256-lr1e-04-local-shuffling-Crosscoder

science-of-finetuning/diffing-stats-gemma-2-2b-gemma-2-2b-it-L13-mu2.5e-02-lr1e-04-local-shuffling-CrosscoderLoss

science-of-finetuning/diffing-stats-Meta-Llama-3.1-8B-L16-k200-lr1e-04-local-shuffling-Crosscoder-ni0.3-ka1k5k

science-of-finetuning/diffing-stats-Meta-Llama-3.1-8B-L16-mu2.0e-02-lr1e-04-local-shuffling-CCLoss

science-of-finetuning/diffing-stats-Meta-Llama-3.1-8B-L16-k222-lr1e-04-local-shuffling-Crosscoder

science-of-finetuning/diffing-stats-Llama-3.2-1B-L8-mu3.6e-02-lr1e-04-local-shuffling-CrosscoderLoss

science-of-finetuning/ultrachat_200k_generated_llama3.1-8b-Instruct-mini

science-of-finetuning/diffing-stats-gemma-2-2b-it-Meditron3-L16-mu3.8e-02-lr1e-04-local-shuffling-CCLoss

AI & ML interests

Recent Activity

Team members 3

Collections 3

models 69 Sort: Recently updated

datasets 98 Sort: Recently updated

models 69

datasets 98