1/4
腾讯频道 - DeepSeek AI - 赌对了!DeepSeek拿新R1蒸馏了Qwen3-...
腾讯频道 - DeepSeek AI - 赌对了!DeepSeek拿新R1蒸馏了Qwen3-...
腾讯频道 - DeepSeek AI - 赌对了!DeepSeek拿新R1蒸馏了Qwen3-...
腾讯频道 - DeepSeek AI - 赌对了!DeepSeek拿新R1蒸馏了Qwen3-...
赌对了!DeepSeek拿新R1蒸馏了Qwen3-8B昨天还在想DeepSeek-R1-0528发布了,会不会有新的蒸馏模型出来呢。
果不其然!基于Qwen3-8B的蒸馏模型DeepSeek-R1-0528-Qwen3-8B(跟之前R1-distill-Qwen-32B类似的技巧)也同步发布了[看R]

[一R] 用了新D1的COT,对Qwen3-8B进行后训练
[二R] 在AIME2024 benchmark上,该模型为开源届的SOTA(比原Qwen3-8B提升10.0%,与Qwen3-235B接近。
[三R] 这意味着新R1的COT更强,对推理模型的教育研究和工业发展都有进一步的提升

最后:能不能发布个Qwen3-32B的官方蒸馏模型啊,急需!
阿里:你的QwQ还继续搞吗?
2025-05-31
浏览89
登录后评论
评论
分享