谷歌力作!让大模型拥有逆向思维>> Reverse Thinking Makes LLMs Stronger Reasoners
>> 逆向思维在人类推理中起着至关重要的作用。人类不仅可以从问题推理到解决方案,还可以逆向推理,即从解决方案出发,推理回问题。这种思维方式通常通过正向和逆向思维的一致性检查来提升整体推理表现。
>> 为了使大型语言模型(LLMs)能够进行逆向思维,我们提出了【逆向增强思维(REVTHINK)】框架,该框架由数据增强和学习目标组成。在REVTHINK中,我们通过从教师模型中收集结构化的正向-逆向推理来增强数据集,包括:(1)原始问题,(2)正向推理,(3)逆向问题,以及(4)逆向推理。然后,我们采用三种目标以多任务学习的方式训练较小的学生模型:(a)从问题生成正向推理,(b)从问题生成逆向问题,(c)从逆向问题生成逆向推理。