RLVR Datasets - a Ji-Xiang Collection

Ji-Xiang 's Collections

Thinking/Reasoning Datasets

WebGPU

HTML to Markdown

Logical Reasoning Datasets

Multilingual-dataset

Object Detection

Multilingual Large Language Models

Recommended Datasets

Multimodal Language Models

traditional-chinese-dataset

Suggestion Models

Uncensored models

unfiltered dataset

Image Generator AI

Voice

Medical

Big Language Models

TTS

Visual Question Answering

Chat

Vision

ORPO-DPO datasets

SLM (small language models)

automatic speech recognition (ASR)

Vision-Language dataset

MoE

Dense Passage Retrieval (DPR) Datasets

background-removal

Extreme Quantization

Try on

RLVR Datasets

updated about 24 hours ago

Reinforcement Learning from Verifiable Rewards (RLVR) Datasets