electroglyph
/

gemma-3-4b-it-unslop-GRPO-v2

Image-Text-to-Text

text-generation-inference

Model card Files Files and versions

electroglyph commited on Aug 20

Commit

8e996b0

·

verified ·

1 Parent(s): 250cb1a

Update README.md

Files changed (1) hide show

README.md +4 -0

README.md CHANGED Viewed

@@ -11,6 +11,10 @@ An unslop finetune of [google/gemma-3-4b-it](https://huggingface.co/google/gemma
 ### Updates / Observations
 I've received some excellent feedback.
 Some usage notes: Low temp recommended. My training technique uses high temp to try to hit slop edge cases, but I ended up baking in some trippiness on accident I think.

 ### Updates / Observations
+An updated version of this model is here: [v3](https://huggingface.co/electroglyph/gemma-3-4b-it-unslop-GRPO-v3)
+---
 I've received some excellent feedback.
 Some usage notes: Low temp recommended. My training technique uses high temp to try to hit slop edge cases, but I ended up baking in some trippiness on accident I think.