1/6
- 下载图片
- 复制图片
Q_Q
谷歌力作!让大模型拥有逆向思维>> Reverse Thinking Makes LLMs Stronger Reasoners
>> 逆向思维在人类推理中起着至关重要的作用。人类不仅可以从问题推理到解决方案,还可以逆向推理,即从解决方案出发,推理回问题。这种思维方式通常通过正向和逆向思维的一致性检查来提升整体推理表现。
>> 为了使大型语言模型(LLMs)能够进行逆向思维,我们提出了【逆向增强思维(REVTHINK)】框架,该框架由数据增强和学习目标组成。在REVTHINK中,我们通过从教师模型中收集结构化的正向-逆向推理来增强数据集,包括:(1)原始问题,(2)正向推理,(3)逆向问题,以及(4)逆向推理。然后,我们采用三种目标以多任务学习的方式训练较小的学生模型:(a)从问题生成正向推理,(b)从问题生成逆向问题,(c)从逆向问题生成逆向推理。
>> 在涵盖常识、数学和逻辑推理的12个数据集上的实验表明,REVTHINK相较于学生模型的零样本性能平均提升了13.53%,并比最强的知识蒸馏基线提升了6.84%。此外,我们的方法展示了样本效率——仅使用训练数据中10%的正确正向推理,其表现优于使用10倍正向推理进行标准微调的方法。REVTHINK还表现出对分布外数据集的强大泛化能力。每日精选
>> 逆向思维在人类推理中起着至关重要的作用。人类不仅可以从问题推理到解决方案,还可以逆向推理,即从解决方案出发,推理回问题。这种思维方式通常通过正向和逆向思维的一致性检查来提升整体推理表现。
>> 为了使大型语言模型(LLMs)能够进行逆向思维,我们提出了【逆向增强思维(REVTHINK)】框架,该框架由数据增强和学习目标组成。在REVTHINK中,我们通过从教师模型中收集结构化的正向-逆向推理来增强数据集,包括:(1)原始问题,(2)正向推理,(3)逆向问题,以及(4)逆向推理。然后,我们采用三种目标以多任务学习的方式训练较小的学生模型:(a)从问题生成正向推理,(b)从问题生成逆向问题,(c)从逆向问题生成逆向推理。
>> 在涵盖常识、数学和逻辑推理的12个数据集上的实验表明,REVTHINK相较于学生模型的零样本性能平均提升了13.53%,并比最强的知识蒸馏基线提升了6.84%。此外,我们的方法展示了样本效率——仅使用训练数据中10%的正确正向推理,其表现优于使用10倍正向推理进行标准微调的方法。REVTHINK还表现出对分布外数据集的强大泛化能力。每日精选
2025-03-16
浏览422
登录后评论
点赞
评论
3