Nishef
/

Qwen3-0.6B-Full_DPO_20251225_130318

Text Generation

preference-optimization

thesis-research

Model card Files Files and versions

Metrics Training metrics Community

Qwen3-0.6B-Full_DPO_20251225_130318 / thesis_plots

Commit History

Add training_time_comparison.png

c925595
verified

Nishef commited on Dec 26, 2025

Add logprobs_Qwen3-0.6B.png

dc1040b
verified

Nishef commited on Dec 26, 2025

Add learning_rate_Qwen3-0.6B.png

ffdec35
verified

Nishef commited on Dec 26, 2025

Add kl_divergence_Qwen3-0.6B.png

19aaabd
verified

Nishef commited on Dec 26, 2025

Add rewards_Qwen3-0.6B.png

19b643a
verified

Nishef commited on Dec 26, 2025

Add training loss curve plot

0e684b6
verified

Nishef commited on Dec 26, 2025

Add thesis benchmark comparison plot

41ae650
verified

Nishef commited on Dec 26, 2025

Add thesis benchmark comparison plot

caeeb40
verified

Nishef commited on Dec 26, 2025

Add Comparative Loss Plot for Thesis

fb4842f
verified

Nishef commited on Dec 25, 2025