赌对了！DeepSeek拿新R1蒸馏了Qwen3-8B昨天还在想DeepSeek-R1｜DeepSeek AI

DeepSeek AI

1/4

泡汤～

管理员

赌对了！DeepSeek拿新R1蒸馏了Qwen3-8B昨天还在想DeepSeek-R1-0528发布了，会不会有新的蒸馏模型出来呢。
果不其然！基于Qwen3-8B的蒸馏模型DeepSeek-R1-0528-Qwen3-8B（跟之前R1-distill-Qwen-32B类似的技巧）也同步发布了[看R]

[一R] 用了新D1的COT，对Qwen3-8B进行后训练
[二R] 在AIME2024 benchmark上，该模型为开源届的SOTA（比原Qwen3-8B提升10.0%，与Qwen3-235B接近。
[三R] 这意味着新R1的COT更强，对推理模型的教育研究和工业发展都有进一步的提升

最后：能不能发布个Qwen3-32B的官方蒸馏模型啊，急需！
阿里：你的QwQ还继续搞吗？

2025-05-31

暂无评论

登录后评论