RLHFlow
/

RewardModel-Mistral-7B-for-DPA-v1

Text Classification

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

RewardModel-Mistral-7B-for-DPA-v1

1 contributor

History: 3 commits

Haoxiang-Wang's picture

Update config.json

57271c4 verified 10 months ago