Perflow-Shuai
/

qwen2-7b-longvila-256f-rl-reformated-0412-model

Model card Files Files and versions Community

Yukang commited on Apr 16

Commit

d55fec2

·

verified ·

1 Parent(s): 26a9012

Upload siglip_encoder.py

Files changed (1) hide show

siglip_encoder.py +2 -2

siglip_encoder.py CHANGED Viewed

@@ -253,7 +253,7 @@ class SiglipVisionTower(VisionTower):
         # TODO(ligengl): why pass config here leading to errors?
         self.vision_tower = SiglipVisionModel.from_pretrained(
             model_name_or_path,
-            attn_implementation=config._attn_implementation,
             torch_dtype=eval(config.model_dtype),
         )
         self.image_processor = SiglipImageProcessor.from_pretrained(model_name_or_path)
@@ -265,7 +265,7 @@ class SiglipVisionTowerS2(VisionTowerS2):
         super().__init__(model_name_or_path, config)
         self.vision_tower = SiglipVisionModel.from_pretrained(
             model_name_or_path,
-            attn_implementation=config._attn_implementation,
             torch_dtype=eval(config.model_dtype),
         )
         self.image_processor = SiglipImageProcessor.from_pretrained(model_name_or_path)

         # TODO(ligengl): why pass config here leading to errors?
         self.vision_tower = SiglipVisionModel.from_pretrained(
             model_name_or_path,
+            attn_implementation="flash_attention_2", #config._attn_implementation,
             torch_dtype=eval(config.model_dtype),
         )
         self.image_processor = SiglipImageProcessor.from_pretrained(model_name_or_path)
         super().__init__(model_name_or_path, config)
         self.vision_tower = SiglipVisionModel.from_pretrained(
             model_name_or_path,
+            attn_implementation="flash_attention_2", #config._attn_implementation,
             torch_dtype=eval(config.model_dtype),
         )
         self.image_processor = SiglipImageProcessor.from_pretrained(model_name_or_path)