Crystalcareai
/

Quiet-Star-Custom

Text Generation

Model card Files Files and versions Community

Crystalcareai commited on Apr 3, 2024

Commit

da23a21

·

verified ·

1 Parent(s): 504a892

Update modeling_quiet.py

Files changed (1) hide show

modeling_quiet.py +2 -2

modeling_quiet.py CHANGED Viewed

@@ -1737,10 +1737,10 @@ class QuietForCausalLM(QuietPreTrainedModel, GenerationMixin):
                         shift_labels = labels[..., 1 + shift_amount:].contiguous()
                         # Flatten the tokens
                         loss_fct = CrossEntropyLoss(reduction="none")
-                        print("Shift logits before:", shift_logits)
                         shift_logits = shift_logits.view(-1, self.config.vocab_size)
                         shift_labels = shift_labels.view(-1).clone()
-                        print("shift logits after:", shift_logits)
                         # Enable model parallelism
                         shift_labels[shift_labels == self.tokenizer.pad_token_id] = -100
                         shift_labels = shift_labels.to(shift_logits.device)

                         shift_labels = labels[..., 1 + shift_amount:].contiguous()
                         # Flatten the tokens
                         loss_fct = CrossEntropyLoss(reduction="none")
+                        # print("Shift logits before:", shift_logits)
                         shift_logits = shift_logits.view(-1, self.config.vocab_size)
                         shift_labels = shift_labels.view(-1).clone()
+                        # print("shift logits after:", shift_logits)
                         # Enable model parallelism
                         shift_labels[shift_labels == self.tokenizer.pad_token_id] = -100
                         shift_labels = shift_labels.to(shift_logits.device)