Qwen
/

Qwen3-Embedding-0.6B

@@ -72,7 +72,7 @@ model = SentenceTransformer("Qwen/Qwen3-Embedding-0.6B")
 # together with setting `padding_side` to "left":
 # model = SentenceTransformer(
 #     "Qwen/Qwen3-Embedding-0.6B",
-#     model_kwargs={"attn_implementation": "flash_attention_2"},
 #     tokenizer_kwargs={"padding_side": "left"},
 # )

 # together with setting `padding_side` to "left":
 # model = SentenceTransformer(
 #     "Qwen/Qwen3-Embedding-0.6B",
+#     model_kwargs={"attn_implementation": "flash_attention_2", "device_map": "auto"},
 #     tokenizer_kwargs={"padding_side": "left"},
 # )