Crystalcareai
/

Quiet-Star-Custom

Text Generation

Model card Files Files and versions Community

Crystalcareai commited on Apr 2, 2024

Commit

8148e82

·

verified ·

1 Parent(s): 9db4c84

Update modeling_quiet.py

Files changed (1) hide show

modeling_quiet.py +2 -2

modeling_quiet.py CHANGED Viewed

@@ -1175,8 +1175,8 @@ class QuietForCausalLM(QuietPreTrainedModel):
         self.vocab_size = config.vocab_size
         self.lm_head = nn.Linear(config.hidden_size, config.vocab_size, bias=False)
         # self.router_aux_loss_coef = config.router_aux_loss_coef
-        self.num_experts = config.num_experts
-        self.num_experts_per_tok = config.num_experts_per_tok
         self.max_thoughts = config.max_thoughts
         self.merged_lm_and_talk_heads = config.merged_lm_and_talk_heads
         self.use_concat_talk_head = config.use_concat_talk_head

         self.vocab_size = config.vocab_size
         self.lm_head = nn.Linear(config.hidden_size, config.vocab_size, bias=False)
         # self.router_aux_loss_coef = config.router_aux_loss_coef
+        # self.num_experts = config.num_experts
+        # self.num_experts_per_tok = config.num_experts_per_tok
         self.max_thoughts = config.max_thoughts
         self.merged_lm_and_talk_heads = config.merged_lm_and_talk_heads
         self.use_concat_talk_head = config.use_concat_talk_head