{
  "_class_name": "CogVideoXTransformer3DModel",
  "_diffusers_version": "0.32.2",
  "_name_or_path": "/mnt/vepfs/base2/chenyixiao/project/cogvideox-train/cache/models--THUDM--CogVideoX-5b/snapshots/8fc5b281006c82b82d34fd2543d2f0ebb4e7e321/transformer",
  "activation_fn": "gelu-approximate",
  "attention_bias": true,
  "attention_head_dim": 64,
  "dropout": 0.0,
  "flip_sin_to_cos": true,
  "freq_shift": 0,
  "in_channels": 16,
  "max_text_seq_length": 226,
  "norm_elementwise_affine": true,
  "norm_eps": 1e-05,
  "num_attention_heads": 48,
  "num_layers": 42,
  "ofs_embed_dim": null,
  "out_channels": 16,
  "patch_bias": true,
  "patch_size": 2,
  "patch_size_t": null,
  "sample_frames": 49,
  "sample_height": 60,
  "sample_width": 90,
  "spatial_interpolation_scale": 1.875,
  "temporal_compression_ratio": 4,
  "temporal_interpolation_scale": 1.0,
  "text_embed_dim": 4096,
  "time_embed_dim": 512,
  "timestep_activation_fn": "silu",
  "use_learned_positional_embeddings": false,
  "use_rotary_positional_embeddings": true
}