Spaces:

evaluate-metric
/

rouge

Running

lvwerra HF staff commited on Aug 18, 2022

Commit

70bcfa7

1 Parent(s): 5473535

Update Space (evaluate main: d5ecbe47)

Files changed (3) hide show

README.md CHANGED Viewed

@@ -42,6 +42,15 @@ At minimum, this metric takes as input a list of predictions and a list of refer
 {'rouge1': 1.0, 'rouge2': 1.0, 'rougeL': 1.0, 'rougeLsum': 1.0}
 ```
 It can also deal with lists of references for each predictions:
 ```python
 >>> rouge = evaluate.load('rouge')

 {'rouge1': 1.0, 'rouge2': 1.0, 'rougeL': 1.0, 'rougeLsum': 1.0}
 ```
+One can also pass a custom tokenizer which is especially useful for non-latin languages.
+```python
+>>> results = rouge.compute(predictions=predictions,
+...                         references=references,
+                            tokenizer=lambda x: x.split())
+>>> print(results)
+{'rouge1': 1.0, 'rouge2': 1.0, 'rougeL': 1.0, 'rougeLsum': 1.0}
+```
 It can also deal with lists of references for each predictions:
 ```python
 >>> rouge = evaluate.load('rouge')

requirements.txt CHANGED Viewed

@@ -1,4 +1,4 @@
-git+https://github.com/huggingface/evaluate@cf7f98201001c9ef673c49ffbcb8439e606e06a6
 absl-py
 nltk
 rouge_score>=0.1.2

+git+https://github.com/huggingface/evaluate@d5ecbe472557e6ec3cf6173e6fe9b4fe67c4919e
 absl-py
 nltk
 rouge_score>=0.1.2

rouge.py CHANGED Viewed

@@ -80,6 +80,16 @@ Examples:
 """
 @evaluate.utils.file_utils.add_start_docstrings(_DESCRIPTION, _KWARGS_DESCRIPTION)
 class Rouge(evaluate.Metric):
     def _info(self):
@@ -108,13 +118,18 @@ class Rouge(evaluate.Metric):
             ],
         )
-    def _compute(self, predictions, references, rouge_types=None, use_aggregator=True, use_stemmer=False):
         if rouge_types is None:
             rouge_types = ["rouge1", "rouge2", "rougeL", "rougeLsum"]
         multi_ref = isinstance(references[0], list)
-        scorer = rouge_scorer.RougeScorer(rouge_types=rouge_types, use_stemmer=use_stemmer)
         if use_aggregator:
             aggregator = scoring.BootstrapAggregator()
         else:

 """
+class Tokenizer:
+    """Helper class to wrap a callable into a class with a `tokenize` method as used by rouge-score."""
+    def __init__(self, tokenizer_func):
+        self.tokenizer_func = tokenizer_func
+    def tokenize(self, text):
+        return self.tokenizer_func(text)
 @evaluate.utils.file_utils.add_start_docstrings(_DESCRIPTION, _KWARGS_DESCRIPTION)
 class Rouge(evaluate.Metric):
     def _info(self):
             ],
         )
+    def _compute(
+        self, predictions, references, rouge_types=None, use_aggregator=True, use_stemmer=False, tokenizer=None
+    ):
         if rouge_types is None:
             rouge_types = ["rouge1", "rouge2", "rougeL", "rougeLsum"]
         multi_ref = isinstance(references[0], list)
+        if tokenizer is not None:
+            tokenizer = Tokenizer(tokenizer)
+        scorer = rouge_scorer.RougeScorer(rouge_types=rouge_types, use_stemmer=use_stemmer, tokenizer=tokenizer)
         if use_aggregator:
             aggregator = scoring.BootstrapAggregator()
         else: