1/18
- 下载图片
- 复制图片
小九(加入频道了解更多)
管理员
字节Seed:Seed-Thinking-v1.5 赶上来了《Seed-Thinking-v1.5: Advancing Superb Reasoning Models with Reinforcement Learning》
Seed-Thinking-v1.5,它能够在响应前通过思考进行推理,从而在广泛的基准测试中提高了性能。Seed-Thinking-v1.5 是一个专家混合模型 (MoE),规模相对较小,具有 200 亿激活参数和 2000 亿总参数。作为我们评估泛化推理能力的一部分,我们开发了两个内部基准测试:BeyondAIME 和 Codeforces,这两个基准测试都将公开发布以支持未来的研究。
基本就是近期Seed一系列论文的集大成了,对于细节可以参考我之前的几篇笔记。
Seed-Thinking-v1.5,它能够在响应前通过思考进行推理,从而在广泛的基准测试中提高了性能。Seed-Thinking-v1.5 是一个专家混合模型 (MoE),规模相对较小,具有 200 亿激活参数和 2000 亿总参数。作为我们评估泛化推理能力的一部分,我们开发了两个内部基准测试:BeyondAIME 和 Codeforces,这两个基准测试都将公开发布以支持未来的研究。
基本就是近期Seed一系列论文的集大成了,对于细节可以参考我之前的几篇笔记。
2025-05-12
浏览78
📖专业知识
登录后评论
1
评论
分享