OsaurusAI
/

gemma-4-E4B-it-8bit

8-bit precision

Model card Files Files and versions

Osaurus-AI commited on 20 days ago

Commit

1dd57a4

·

verified ·

1 Parent(s): 9138355

Update usage to Osaurus branding

Files changed (1) hide show

README.md +5 -7

README.md CHANGED Viewed

@@ -61,9 +61,13 @@ Every tensor in every multimodal component was loaded and checked for `max(abs(t
 ## Usage
-### With mlx-vlm
 ```python
 from mlx_vlm import load, generate
 model, processor = load("OsaurusAI/gemma-4-E4B-it-8bit")
@@ -75,12 +79,6 @@ output = generate(model, processor, "Explain quantum computing", max_tokens=500)
 output = generate(model, processor, "Describe this image", ["path/to/image.jpg"], max_tokens=500)
 ```
-### With vMLX / vllm-mlx
-```bash
-vllm-mlx serve OsaurusAI/gemma-4-E4B-it-8bit
-```
 ## Conversion Details
 | Detail | Value |

 ## Usage
+```bash
+# Requires Osaurus (https://osaurus.ai)
+osaurus serve OsaurusAI/gemma-4-E4B-it-8bit
+```
 ```python
+# Python API
 from mlx_vlm import load, generate
 model, processor = load("OsaurusAI/gemma-4-E4B-it-8bit")
 output = generate(model, processor, "Describe this image", ["path/to/image.jpg"], max_tokens=500)
 ```
 ## Conversion Details
 | Detail | Value |