Spaces:

yusufs
/

sailor2-3b-chat

Paused

sailor2-3b-chat / download_model.py

feat(reduce-max-num-batched-tokens): Reducing max-num-batched-tokens even the error state it want to reduce max_model_len

13a5c22 7 months ago

503 Bytes

	import os
	from huggingface_hub import snapshot_download
	from transformers.utils.hub import move_cache

	hf_token: str = os.getenv("HF_TOKEN")
	if hf_token is None:
	raise ValueError("HF_TOKEN is not set")

	hf_token = hf_token.strip()
	if hf_token == "":
	raise ValueError("HF_TOKEN is empty")

	snapshot_download(
	repo_id="sail/Sailor-4B-Chat",
	revision="89a866a7041e6ec023dd462adeca8e28dd53c83e",
	token=hf_token,
	)

	# https://github.com/huggingface/transformers/issues/20428
	move_cache()