Spaces:

nvidia
/

audio-flamingo-3

Running on Zero

SreyanG-NVIDIA commited on 19 days ago

Commit

e110d57

verified ·

1 Parent(s): 253048f

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -14,11 +14,19 @@ MODEL_BASE_THINK = os.path.join(MODEL_BASE_SINGLE, 'stage35')
 # model_single = llava.load(MODEL_BASE_SINGLE, model_base=None, devices=[0])
 model_single = llava.load(MODEL_BASE_SINGLE, model_base=None)
-model_single = model_single.to("cuda")
-model_single_copy = copy.deepcopy(model_single)
 generation_config_single = model_single.default_generation_config
 model_think = PeftModel.from_pretrained(
         model_single,
         MODEL_BASE_THINK,

 # model_single = llava.load(MODEL_BASE_SINGLE, model_base=None, devices=[0])
 model_single = llava.load(MODEL_BASE_SINGLE, model_base=None)
+model_single = model_single.to("cuda")
+model_single_copy = copy.deepcopy(model_single) # keep a copy of the original model for non-thinking mode
 generation_config_single = model_single.default_generation_config
+non_lora_trainables = torch.load(
+                os.path.join(MODEL_BASE_THINK, "non_lora_trainables.bin"),
+                map_location="cpu",
+            )
+non_lora_trainables = {
+        (k[6:] if k.startswith("model.") else k): v for k, v in non_lora_trainables.items()
+    }
+model.load_state_dict(non_lora_trainables, strict=False)
 model_think = PeftModel.from_pretrained(
         model_single,
         MODEL_BASE_THINK,