Emilio407
/

Dolphin3.0-Qwen2.5-0.5B-GRPO-V1

Text Generation

text-generation-inference

Model card Files Files and versions

BAD PERFORMANCE

Uploaded model

Developed by: Emilio407
License: apache-2.0
Finetuned from model : cognitivecomputations/Dolphin3.0-Qwen2.5-0.5B

This qwen2 model was trained 2x faster with Unsloth and Huggingface's TRL library.

Downloads last month: 30

Safetensors

Model size

0.5B params

Tensor type

F16

·

Model tree for Emilio407/Dolphin3.0-Qwen2.5-0.5B-GRPO-V1

Base model

Qwen/Qwen2.5-0.5B

Finetuned

dphn/Dolphin3.0-Qwen2.5-0.5B

Finetuned

(3)

this model

Finetunes

Quantizations

Space using Emilio407/Dolphin3.0-Qwen2.5-0.5B-GRPO-V1 1