Bit Transformer Dashboard

Initialize Model

Train Step

Load sample dataset:

Scale Up

Width Mult:

Collapse Submodel

Inference

Long Inference

Text Inference

λ Weights

Diffusion LM

Enable Diffusion Mode

GPU Acceleration

Enable FSDP & CUDA

Enable Compression

Compress I/O

Ratio: 1.0

Quantization Aware Training

Enable 4-bit QAT

Model Status

Telemetry

Hugging Face Checkpoints

Repo ID:
Token: