Layer Addition Models - a ssmits Collection

ssmits 's Collections

Falcon2

Layer Addition Models

Layer Addition Models

updated Nov 22, 2024

Strategic merging of language models through layer-level architecture optimization.

ssmits/Llama-3.1-Nemotron-92B-Instruct-HF-early

Text Generation • 92B • Updated Nov 1, 2024 • 6 • 2
ssmits/Llama-3.1-Nemotron-92B-Instruct-HF-late

Text Generation • 92B • Updated Nov 1, 2024 • 5 • 2
ssmits/Qwen2.5-95B-Instruct

Text Generation • 95B • Updated Oct 31, 2024 • 12 • 4
ssmits/Qwen2.5-125B-Instruct

Text Generation • 125B • Updated Sep 24, 2024 • 3