Edit Models filters

Misc

arxiv: 2310.08164

AutoTrain Compatible

Inference Endpoints

text-generation-inference

Misc with no match

4-bit precision

8-bit precision

text-embeddings-inference

Carbon Emissions

Mixture of Experts

Models

6

Full-text search

Active filters: 2310.08164

amirabdullah19852020/pythia-160m_sentiment_reward

Reinforcement Learning • Updated Feb 10, 2024 • 22

amirabdullah19852020/pythia-70m_sentiment_reward

Reinforcement Learning • Updated Feb 10, 2024 • 14

amirabdullah19852020/pythia-70m_utility_reward

Reinforcement Learning • Updated Feb 10, 2024 • 21

amirabdullah19852020/pythia-160m_utility_reward

Reinforcement Learning • Updated Feb 10, 2024 • 15

amirabdullah19852020/gpt-neo-125m_sentiment_reward

Reinforcement Learning • Updated Feb 10, 2024 • 14

amirabdullah19852020/gpt-neo-125m_utility_reward

Reinforcement Learning • Updated Feb 10, 2024 • 12