1/3
腾讯频道 - DeepSeek AI - 英伟达开源超大规模数学推理数据集OpenMathR...
腾讯频道 - DeepSeek AI - 英伟达开源超大规模数学推理数据集OpenMathR...
腾讯频道 - DeepSeek AI - 英伟达开源超大规模数学推理数据集OpenMathR...
英伟达开源超大规模数学推理数据集OpenMathReasoning 是一个用于训练大语言模型(LLMs)的大规模数学推理数据集。该数据集包含:

1. 源自AoPS论坛的54万道独特数学题
2. 320万条长链式思维(CoT)解答
3. 170万条工具集成推理(TIR)解答
4. 56.6万条从多个候选方案中选择最优解的样本(GenSelect)

使用Qwen2.5-32B-Instruct进行题目预处理,并采用DeepSeek-R1和QwQ-32B自动生成解答方案。

该数据集是其赢得AIMO-2 Kaggle竞赛的核心基础。
deepseek
2025-04-24
浏览183
登录后评论
评论
2