moodlep
/

smollm2-17b-dpo-cai-v1

alignment-handbook

Generated from Trainer

4-bit precision

Model card Files Files and versions Metrics Training metrics Community

smollm2-17b-dpo-cai-v1 / runs

Commit History

End of training

9f43716
verified

moodlep commited on 11 days ago

Training in progress, step 257

3502899
verified

moodlep commited on 11 days ago

Training in progress, step 200

a0fe6cf
verified

moodlep commited on 11 days ago

Training in progress, step 100

b1e40b1
verified

moodlep commited on 11 days ago