martimfasantos
/

tinyllama-1.1b-mt-dpo-full_LR5e-8_BS16_adamw_3epochs

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

tinyllama-1.1b-mt-dpo-full_LR5e-8_BS16_adamw_3epochs / README.md

Commit History

End of training

c237ae5
verified

martimfasantos commited on Jul 9, 2024

Model save

f2e2a3a
verified

martimfasantos commited on Jul 9, 2024

End of training

52aa027
verified

martimfasantos commited on Jul 9, 2024

Model save

9d61ede
verified

martimfasantos commited on Jul 9, 2024