Qwen
/

Qwen3-4B-FP8

Text Generation

text-generation-inference

Model card Files Files and versions

Commit History

Update README.md

5dad03d
verified

littlebird13 commited on 22 days ago

update tokenizer_config.json

f3ecd40

feihu.hf commited on 24 days ago

Remove vLLM FP8 Limitation (#2)

d968998
verified

simon-mo commited on Apr 30

Update README.md

0dcffbe
verified

yangapku commited on Apr 29

Update README.md

884ae87
verified

yangapku commited on Apr 29

Update README.md

bcd75a3
verified

yangapku commited on Apr 28

Update README.md

35fec96
verified

littlebird13 commited on Apr 28

Update README.md

1ef33a9
verified

jklj077 commited on Apr 28

Delete special_tokens_map.json

97f8501
verified

littlebird13 commited on Apr 28

Delete added_tokens.json

be2fe05
verified

littlebird13 commited on Apr 28

Update README.md

c1919f6
verified

littlebird13 commited on Apr 28

Update generation_config.json

e66e5a4
verified

littlebird13 commited on Apr 28

Update README.md

1d3f2ab
verified

littlebird13 commited on Apr 28

Upload folder using huggingface_hub

ae9c71f
verified

littlebird13 commited on Apr 28

initial commit

3fdd654
verified

littlebird13 commited on Apr 28