Model save

Files changed (7) hide show

README.md CHANGED Viewed

@@ -40,9 +40,9 @@ The following hyperparameters were used during training:
 - seed: 42
 - gradient_accumulation_steps: 8
 - total_train_batch_size: 32
-- optimizer: Use adamw_torch with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
-- num_epochs: 0.05
 - mixed_precision_training: Native AMP
 ### Training results
@@ -52,7 +52,7 @@ The following hyperparameters were used during training:
 ### Framework versions
 - PEFT 0.14.0
-- Transformers 4.49.0
 - Pytorch 2.5.1+cu124
-- Datasets 3.2.0
 - Tokenizers 0.21.0

 - seed: 42
 - gradient_accumulation_steps: 8
 - total_train_batch_size: 32
+- optimizer: Use OptimizerNames.ADAMW_TORCH with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
+- num_epochs: 0.5
 - mixed_precision_training: Native AMP
 ### Training results
 ### Framework versions
 - PEFT 0.14.0
+- Transformers 4.48.3
 - Pytorch 2.5.1+cu124
+- Datasets 3.3.2
 - Tokenizers 0.21.0

adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:519a6cb37030a99d0ba86b56b9cd7a953d8173b7650a9dc2e6073bd06956acf3
 size 1442871112

 version https://git-lfs.github.com/spec/v1
+oid sha256:1b47b4af34457806b0caf9903e15c5b7a20affd88c14ad3335df0cf005c38f07
 size 1442871112

final_model/adapter_config.json CHANGED Viewed

@@ -23,13 +23,13 @@
   "rank_pattern": {},
   "revision": null,
   "target_modules": [
-    "gate_proj",
-    "o_proj",
-    "k_proj",
     "up_proj",
     "q_proj",
-    "down_proj",
-    "v_proj"
   ],
   "task_type": "CAUSAL_LM",
   "use_dora": false,

   "rank_pattern": {},
   "revision": null,
   "target_modules": [
     "up_proj",
+    "v_proj",
+    "o_proj",
     "q_proj",
+    "gate_proj",
+    "k_proj",
+    "down_proj"
   ],
   "task_type": "CAUSAL_LM",
   "use_dora": false,

final_model/adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:52a7c88481c75d8e842cf5f7a62f36932ebdb0a8097c2e4a3ad01a7a672536c7
 size 1442871112

 version https://git-lfs.github.com/spec/v1
+oid sha256:1b47b4af34457806b0caf9903e15c5b7a20affd88c14ad3335df0cf005c38f07
 size 1442871112

final_model/tokenizer_config.json CHANGED Viewed

@@ -2062,6 +2062,6 @@
   "model_max_length": 131072,
   "pad_token": "<|finetune_right_pad_id|>",
   "padding_side": "right",
-  "tokenizer_class": "PreTrainedTokenizer",
   "unk_token": null
 }

   "model_max_length": 131072,
   "pad_token": "<|finetune_right_pad_id|>",
   "padding_side": "right",
+  "tokenizer_class": "PreTrainedTokenizerFast",
   "unk_token": null
 }

final_model/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ed9441d88e6c404cbe962e1445b42663b37c861e983aaa7ce5cd26b652ec96a9
 size 5432

 version https://git-lfs.github.com/spec/v1
+oid sha256:4000f14248fd06aa19a74a6004f4267910a92ee75d9adceb5098f518c1ef0fd7
 size 5432

runs/Feb28_19-54-30_731f2cbee5ec/events.out.tfevents.1740772475.731f2cbee5ec.226.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e184d1342fa6c640042d0f7d7d9a49bb4ec44dca507479a949e7af9395900e2a
-size 5877

 version https://git-lfs.github.com/spec/v1
+oid sha256:70d13628a05cea17d8b992a27311a6f00a9a2a7826c022baeb75c7b6ca6197e4
+size 6231