second-state
/

gemma-3-1b-it-GGUF

Text Generation

Model card Files Files and versions Community

apepkuss79 commited on 9 days ago

Commit

adf63e1

·

verified ·

1 Parent(s): 0688ddf

Update README.md

Files changed (1) hide show

README.md +3 -3

README.md CHANGED Viewed

@@ -40,7 +40,7 @@ pipeline_tag: text-generation
     {model_message}<end_of_turn>model
     ```
-- Context size: `128000`
 - Run as LlamaEdge service
@@ -48,7 +48,7 @@ pipeline_tag: text-generation
   wasmedge --dir .:. --nn-preload default:GGML:AUTO:gemma-3-1b-it-Q5_K_M.gguf \
     llama-api-server.wasm \
     --prompt-template gemma-3 \
-    --ctx-size 128000 \
     --model-name gemma-3-1b
   ```
@@ -59,7 +59,7 @@ pipeline_tag: text-generation
     --nn-preload default:GGML:AUTO:gemma-3-1b-it-Q5_K_M.gguf \
     llama-chat.wasm \
     --prompt-template gemma-3 \
-    --ctx-size 128000
   ```
 ## Quantized GGUF Models

     {model_message}<end_of_turn>model
     ```
+- Context size: `32000`
 - Run as LlamaEdge service
   wasmedge --dir .:. --nn-preload default:GGML:AUTO:gemma-3-1b-it-Q5_K_M.gguf \
     llama-api-server.wasm \
     --prompt-template gemma-3 \
+    --ctx-size 32000 \
     --model-name gemma-3-1b
   ```
     --nn-preload default:GGML:AUTO:gemma-3-1b-it-Q5_K_M.gguf \
     llama-chat.wasm \
     --prompt-template gemma-3 \
+    --ctx-size 32000
   ```
 ## Quantized GGUF Models