thegovind
/

azure-advisor-qwen25-0.5b-grpo

Text Generation

reinforcement-learning

Model card Files Files and versions

azure-advisor-qwen25-0.5b-grpo / adapter_model.safetensors

Commit History

Upload model

3a91890
verified

thegovind commited on Mar 18