allenai
/

Olmo-Hybrid-Instruct-DPO-7B

@@ -1,6 +1,6 @@
 {
   "architectures": [
-    "Olmo3_2HybridForCausalLM"
   ],
   "attention_bias": false,
   "attention_dropout": 0.0,
@@ -49,10 +49,9 @@
   "linear_key_head_dim": 96,
   "linear_num_key_heads": 30,
   "linear_num_value_heads": 30,
-  "linear_use_gate": true,
   "linear_value_head_dim": 192,
   "max_position_embeddings": 32768,
-  "model_type": "olmo3_2_hybrid",
   "num_attention_heads": 30,
   "num_hidden_layers": 32,
   "num_key_value_heads": 30,

 {
   "architectures": [
+    "OlmoHybridForCausalLM"
   ],
   "attention_bias": false,
   "attention_dropout": 0.0,
   "linear_key_head_dim": 96,
   "linear_num_key_heads": 30,
   "linear_num_value_heads": 30,
   "linear_value_head_dim": 192,
   "max_position_embeddings": 32768,
+  "model_type": "olmo_hybrid",
   "num_attention_heads": 30,
   "num_hidden_layers": 32,
   "num_key_value_heads": 30,

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3d9b9405c869a3bc9ecebae0d1a76457c061ee29d2e716a66ee7544b90a86353
-size 14861802784

 version https://git-lfs.github.com/spec/v1
+oid sha256:40db118a86509576789d22a89dc09db3a91a0963f602c44c76d6ca678f58a324
+size 14861802680