LLM evals and benchmark datasets
updated
Viewer
•
Updated
•
8.11k
•
5.08k
•
81
Viewer
•
Updated
•
164
•
71.2k
•
257
Viewer
•
Updated
•
541
•
6.64k
•
45
Viewer
•
Updated
•
7.79k
•
109k
•
163
Updated
•
80.7k
•
58
Viewer
•
Updated
•
12.1k
•
33.7k
•
304
Viewer
•
Updated
•
231k
•
91.7k
•
352
Viewer
•
Updated
•
1.63k
•
25.6k
•
212
Viewer
•
Updated
•
17.6k
•
172k
•
479
Viewer
•
Updated
•
60k
•
104k
•
100
Updated
•
30.3k
•
51
HuggingFaceH4/mt_bench_prompts
Viewer
•
Updated
•
80
•
211
•
16
Viewer
•
Updated
•
34.6k
•
1.14k
•
103
Viewer
•
Updated
•
95.4k
•
2.72k
•
36