1/4
- 下载图片
- 复制图片
云云
管理员
赌对了!DeepSeek拿新R1蒸馏了Qwen3-8B昨天还在想DeepSeek-R1-0528发布了,会不会有新的蒸馏模型出来呢。
果不其然!基于Qwen3-8B的蒸馏模型DeepSeek-R1-0528-Qwen3-8B(跟之前R1-distill-Qwen-32B类似的技巧)也同步发布了[看R]
[一R] 用了新D1的COT,对Qwen3-8B进行后训练
[二R] 在AIME2024 benchmark上,该模型为开源届的SOTA(比原Qwen3-8B提升10.0%,与Qwen3-235B接近。
[三R] 这意味着新R1的COT更强,对推理模型的教育研究和工业发展都有进一步的提升
最后:能不能发布个Qwen3-32B的官方蒸馏模型啊,急需!
阿里:你的QwQ还继续搞吗?
果不其然!基于Qwen3-8B的蒸馏模型DeepSeek-R1-0528-Qwen3-8B(跟之前R1-distill-Qwen-32B类似的技巧)也同步发布了[看R]
[一R] 用了新D1的COT,对Qwen3-8B进行后训练
[二R] 在AIME2024 benchmark上,该模型为开源届的SOTA(比原Qwen3-8B提升10.0%,与Qwen3-235B接近。
[三R] 这意味着新R1的COT更强,对推理模型的教育研究和工业发展都有进一步的提升
最后:能不能发布个Qwen3-32B的官方蒸馏模型啊,急需!
阿里:你的QwQ还继续搞吗?
2025-05-31
浏览89
登录后评论
1
评论
分享