DUAL-GPO
/

phi-2-ipo-chatml-lora-20k-40k-i1

alignment-handbook

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

phi-2-ipo-chatml-lora-20k-40k-i1 / adapter_model.safetensors

Commit History

Model save

0caa5c2
verified

BraylonDash commited on Sep 14, 2024

Training in progress, step 600

daac5da
verified

BraylonDash commited on Sep 14, 2024

Training in progress, step 500

7f924df
verified

BraylonDash commited on Sep 14, 2024

Training in progress, step 400

d4443a5
verified

BraylonDash commited on Sep 14, 2024

Training in progress, step 300

e2393a8
verified

BraylonDash commited on Sep 14, 2024

Training in progress, step 200

37a18c8
verified

BraylonDash commited on Sep 14, 2024

Training in progress, step 100

1c7fdf7
verified

BraylonDash commited on Sep 14, 2024