sergiopaniego
/

smolvlm-instruct-trl-dpo-rlaif-v

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

smolvlm-instruct-trl-dpo-rlaif-v / merges.txt

sergiopaniego's picture

Training in progress, step 12

51dde93 verified 28 days ago

history contribute delete

466 kB

File too large to display, you can check the raw version instead.