Add files using upload-large-folder tool

Browse files

Files changed (4) hide show

config.json +56 -3
hf_quant_config.json +0 -0
model.safetensors +2 -2
video_preprocessor_config.json +30 -0

config.json CHANGED Viewed

@@ -145,11 +145,64 @@
     },
     "vision_soft_tokens_per_image": 280,
     "quantization_config": {
-        "ignore": [],
-        "quant_algo": "MIXED_PRECISION",
         "producer": {
             "name": "modelopt",
-            "version": "0.42.0"
         },
         "quant_method": "modelopt"
     }

     },
     "vision_soft_tokens_per_image": 280,
     "quantization_config": {
+        "config_groups": {
+            "group_0": {
+                "input_activations": {
+                    "dynamic": false,
+                    "num_bits": 4,
+                    "type": "float",
+                    "group_size": 16
+                },
+                "weights": {
+                    "dynamic": false,
+                    "num_bits": 4,
+                    "type": "float",
+                    "group_size": 16
+                },
+                "targets": [
+                    "Linear"
+                ]
+            }
+        },
+        "ignore": [
+            "lm_head",
+            "model.embed_vision*",
+            "model.language_model.layers.0.router*",
+            "model.language_model.layers.1.router*",
+            "model.language_model.layers.10.router*",
+            "model.language_model.layers.11.router*",
+            "model.language_model.layers.12.router*",
+            "model.language_model.layers.13.router*",
+            "model.language_model.layers.14.router*",
+            "model.language_model.layers.15.router*",
+            "model.language_model.layers.16.router*",
+            "model.language_model.layers.17.router*",
+            "model.language_model.layers.18.router*",
+            "model.language_model.layers.19.router*",
+            "model.language_model.layers.2.router*",
+            "model.language_model.layers.20.router*",
+            "model.language_model.layers.21.router*",
+            "model.language_model.layers.22.router*",
+            "model.language_model.layers.23.router*",
+            "model.language_model.layers.24.router*",
+            "model.language_model.layers.25.router*",
+            "model.language_model.layers.26.router*",
+            "model.language_model.layers.27.router*",
+            "model.language_model.layers.28.router*",
+            "model.language_model.layers.29.router*",
+            "model.language_model.layers.3.router*",
+            "model.language_model.layers.4.router*",
+            "model.language_model.layers.5.router*",
+            "model.language_model.layers.6.router*",
+            "model.language_model.layers.7.router*",
+            "model.language_model.layers.8.router*",
+            "model.language_model.layers.9.router*",
+            "model.vision_tower*"
+        ],
+        "quant_algo": "NVFP4",
         "producer": {
             "name": "modelopt",
+            "version": "0.43.0rc2.dev114+g952a62bf6"
         },
         "quant_method": "modelopt"
     }

hf_quant_config.json CHANGED Viewed

The diff for this file is too large to render. See raw diff

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:86a144cd413aebe8306a6a746b2c2efb339728b03f321eb1122a2805c2e3784d
-size 16807156168

 version https://git-lfs.github.com/spec/v1
+oid sha256:8b826e3ff3849901be01ed8eb18e2ccb321332c717d97c4cdfbfa87c8effff7b
+size 16423438668

video_preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,30 @@

+{
+  "do_convert_rgb": true,
+  "do_normalize": true,
+  "do_rescale": true,
+  "do_resize": true,
+  "do_sample_frames": true,
+  "image_mean": [
+    0.0,
+    0.0,
+    0.0
+  ],
+  "image_std": [
+    1.0,
+    1.0,
+    1.0
+  ],
+  "num_frames": 32,
+  "patch_size": 16,
+  "max_soft_tokens": 280,
+  "pooling_kernel_size": 3,
+  "resample": 3,
+  "rescale_factor": 0.00392156862745098,
+  "size": {
+    "height": 224,
+    "width": 224
+  },
+  "default_to_square": true,
+  "processor_class": "Gemma4Processor",
+  "video_processor_type": "Gemma4VideoProcessor"
+}