second-state
/

Qwen2-7B-Instruct-GGUF

@@ -48,13 +48,20 @@ tags:
 - Run as LlamaEdge service
   ```bash
-  wasmedge --dir .:. --nn-preload default:GGML:AUTO:Qwen2-7B-Instruct-Q5_K_M.gguf llama-api-server.wasm -p chatml
   ```
 - Run as LlamaEdge command app
   ```bash
-  wasmedge --dir .:. --nn-preload default:GGML:AUTO:Qwen2-7B-Instruct-Q5_K_M.gguf llama-chat.wasm -p chatml
   ```
 ## Quantized GGUF Models

 - Run as LlamaEdge service
   ```bash
+  wasmedge --dir .:. --nn-preload default:GGML:AUTO:Qwen2-7B-Instruct-Q5_K_M.gguf \
+    llama-api-server.wasm \
+    --model-name Qwen2-7B-Instruct \
+    --prompt-template chatml \
+    --ctx-size 131072
   ```
 - Run as LlamaEdge command app
   ```bash
+  wasmedge --dir .:. --nn-preload default:GGML:AUTO:Qwen2-7B-Instruct-Q5_K_M.gguf \
+    llama-chat.wasm \
+    --prompt-template chatml \
+    --ctx-size 131072
   ```
 ## Quantized GGUF Models