GGUF Quantized Model

This is a GGUF quantized version of iben/medical model, optimized for use with llama.cpp.

Model Details

This model can be used with llama.cpp or other GGUF-compatible inference engines.

GGUF

Model size

7.62B params

Architecture

qwen2

Hardware compatibility

8-bit

Inference Providers NEW

This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Base model

Qwen/Qwen2.5-7B

Finetuned

Finetuned

Finetuned

Quantized

(1)

this model