XueyingJia
/

qwen-0.5b-sft-HH-online-dpo-ground-truth-lead

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

qwen-0.5b-sft-HH-online-dpo-ground-truth-lead / runs /Dec10_12-22-09_babel-0-23

Commit History

Training in progress, step 400

f2619d6
verified

XueyingJia commited on Dec 10, 2024

Training in progress, step 300

215b313
verified

XueyingJia commited on Dec 10, 2024

Training in progress, step 200

9c5c90c
verified

XueyingJia commited on Dec 10, 2024

Training in progress, step 100

0e62120
verified

XueyingJia commited on Dec 10, 2024