hector-gr
/

RLCR-2p5x-priority-bestreward-math

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

RLCR-2p5x-priority-bestreward-math / milestone-checkpoint-832 /special_tokens_map.json

Commit History

Model save

f0504c1
verified

hector-gr commited on 1 day ago