zerowsw
/

coderm-8b

@@ -1,9 +1,11 @@
 ---
 base_model: KAKA22/CodeRM-8B
 library_name: transformers
 model_name: coderm-8b
 tags:
 - generated_from_trainer
 - trl
 - grpo
 licence: license
@@ -11,7 +13,7 @@ licence: license
 # Model Card for coderm-8b
-This model is a fine-tuned version of [KAKA22/CodeRM-8B](https://huggingface.co/KAKA22/CodeRM-8B).
 It has been trained using [TRL](https://github.com/huggingface/trl).
 ## Quick start

 ---
 base_model: KAKA22/CodeRM-8B
+datasets: zzzzit/taco3
 library_name: transformers
 model_name: coderm-8b
 tags:
 - generated_from_trainer
+- open-r1
 - trl
 - grpo
 licence: license
 # Model Card for coderm-8b
+This model is a fine-tuned version of [KAKA22/CodeRM-8B](https://huggingface.co/KAKA22/CodeRM-8B) on the [zzzzit/taco3](https://huggingface.co/datasets/zzzzit/taco3) dataset.
 It has been trained using [TRL](https://github.com/huggingface/trl).
 ## Quick start