jadohu
/

Qwen2.5-32B-GRPO

Reinforcement Learning

Model card Files Files and versions

Qwen2.5-32B-GRPO / model-00007-of-00014.safetensors

Commit History

Upload folder using huggingface_hub

7ba5943
verified

jadohu commited on Nov 25, 2025