neuralmagic
/

Nous-Hermes-2-Yi-34B-marlin

Text Generation

text-generation-inference

Inference Endpoints

4-bit precision

Model card Files Files and versions Community

Nous-Hermes-2-Yi-34B-marlin / quantization

1 contributor

History: 2 commits

robertgshaw2's picture

Create requirements.txt

ba190a7 verified about 1 year ago

apply_gptq_save_marlin.py

2.2 kB

Create quantization/apply_gptq_save_marlin.py about 1 year ago
requirements.txt

51 Bytes

Create requirements.txt about 1 year ago