Ejafa
/

qwen2-0.5b-instruct-simpo-lr-5e-07-gamma-1.5

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

qwen2-0.5b-instruct-simpo-lr-5e-07-gamma-1.5 / README.md

Commit History

Update README.md

3a859d7
verified

Ejafa commited on Jun 25, 2024

End of training

27c750e
verified

Ejafa commited on Jun 21, 2024

Model save

4e7d847
verified

Ejafa commited on Jun 21, 2024