moodlep
/

smollm2-17b-dpo-cai-v1

alignment-handbook

Generated from Trainer

4-bit precision

Model card Files Files and versions Metrics Training metrics Community

smollm2-17b-dpo-cai-v1 / runs

1 contributor

History: 4 commits

moodlep's picture

End of training

9f43716 verified 10 days ago