Jiarui Yao's picture

Jiarui Yao

FlippyDora

·

AI & ML interests

None yet

Recent Activity

upvoted a paper about 10 hours ago

Flow-DPPO: Divergence Proximal Policy Optimization for Flow Matching Models

upvoted a paper about 10 hours ago

Rethinking the Divergence Regularization in LLM RL

upvoted a paper about 15 hours ago

Lean4Agent: Formal Modeling and Verification for Agent Workflow and Trajectory

View all activity

Organizations

Papers 9

arxiv:2601.10201

arxiv:2604.13346

arxiv:2603.13985

arxiv:2510.12693

models 65

FlippyDora/CorrectKLinRL

FlippyDora/qwen3-asr-1.7b-GGUF

2B • Updated Feb 11 • 1.54k • 2

FlippyDora/qwen3-asr-0.6b-GGUF

0.9B • Updated Feb 10 • 43 • 1

FlippyDora/anlp-hw2-outputs

Updated Oct 21, 2025

FlippyDora/all-MiniLM-L6-v2-imdb-sentiment

Text Classification • 22.7M • Updated Sep 23, 2025 • 4

FlippyDora/Qwen2_5_3B_inst_hrm_init

Text Generation • 4B • Updated Aug 5, 2025 • 3 • 1

FlippyDora/slimpajama-train-1280k

Updated May 10, 2025

FlippyDora/Qwen2.5-Math-1.5B-ppo_numina_math-step_120

2B • Updated Mar 17, 2025 • 3

FlippyDora/Qwen2.5-Math-1.5B-ppo_numina_math-step_100

2B • Updated Mar 17, 2025 • 2

FlippyDora/Qwen2.5-Math-1.5B-ppo_numina_math-step_80

2B • Updated Mar 17, 2025 • 2

datasets 117

FlippyDora/dapo-filter

Viewer • Updated Apr 21 • 9.45k • 48

FlippyDora/olympiad_bench

Viewer • Updated May 1, 2025 • 675 • 35

FlippyDora/minerva_math

Viewer • Updated May 1, 2025 • 272 • 15

FlippyDora/math500

Viewer • Updated May 1, 2025 • 500 • 78

FlippyDora/amc23

Viewer • Updated May 1, 2025 • 40 • 20

FlippyDora/aime24

Viewer • Updated May 1, 2025 • 30 • 27

FlippyDora/raft_train_numia_prompt_iter5_0_2000

Viewer • Updated Mar 11, 2025 • 6.75k • 19

FlippyDora/numia_prompt_reward_iter5_0-2000

Viewer • Updated Mar 11, 2025 • 2k • 12

FlippyDora/raft_train_numia_prompt_iter4_0_2000

Viewer • Updated Mar 11, 2025 • 6.86k • 32

FlippyDora/numia_prompt_reward_iter4_0-2000

Viewer • Updated Mar 11, 2025 • 2k • 14

View 117 datasets