bearzi
/

gemma-4-31B-it-JANG_2M

Text Generation

mixed-precision

Model card Files Files and versions

bearzi commited on 9 days ago

Commit

f35573d

·

verified ·

1 Parent(s): b62ecdf

Update README.md

Files changed (1) hide show

README.md +10 -0

README.md CHANGED Viewed

@@ -12,6 +12,16 @@ tags:
 - apple-silicon
 ---
 # gemma-4-31B-it-JANG_2M
 JANG adaptive mixed-precision MLX quantization produced via [vmlx / jang-tools](https://github.com/jjang-ai/jangq).

 - apple-silicon
 ---
+## ⚠️ Low-bit quality warning
+This is an aggressive quantization (2-bit average). At this compression level, output quality degrades noticeably — responses may start coherent but degenerate into repetition or garbage tokens toward the end of longer generations. This is expected behavior for 2-bit quantization on this architecture.
+**Recommended for:** experimentation, quick testing, extreme memory constraints.
+**Not recommended for:** production use, long-form generation, coding tasks.
+For reliable output quality, use JANG_4M or higher profiles from this collection.
 # gemma-4-31B-it-JANG_2M
 JANG adaptive mixed-precision MLX quantization produced via [vmlx / jang-tools](https://github.com/jjang-ai/jangq).