1/3
- 下载图片
- 复制图片
云云
管理员
英伟达开源超大规模数学推理数据集OpenMathReasoning 是一个用于训练大语言模型(LLMs)的大规模数学推理数据集。该数据集包含:
1. 源自AoPS论坛的54万道独特数学题
2. 320万条长链式思维(CoT)解答
3. 170万条工具集成推理(TIR)解答
4. 56.6万条从多个候选方案中选择最优解的样本(GenSelect)
使用Qwen2.5-32B-Instruct进行题目预处理,并采用DeepSeek-R1和QwQ-32B自动生成解答方案。
该数据集是其赢得AIMO-2 Kaggle竞赛的核心基础。
deepseek
1. 源自AoPS论坛的54万道独特数学题
2. 320万条长链式思维(CoT)解答
3. 170万条工具集成推理(TIR)解答
4. 56.6万条从多个候选方案中选择最优解的样本(GenSelect)
使用Qwen2.5-32B-Instruct进行题目预处理,并采用DeepSeek-R1和QwQ-32B自动生成解答方案。
该数据集是其赢得AIMO-2 Kaggle竞赛的核心基础。
deepseek
2025-04-24
浏览183
登录后评论
1
评论
2