1/3
腾讯频道 - DeepSeek AI - 新模型!拥有 DeepSeek R1 + V3 两...
腾讯频道 - DeepSeek AI - 新模型!拥有 DeepSeek R1 + V3 两...
腾讯频道 - DeepSeek AI - 新模型!拥有 DeepSeek R1 + V3 两...
新模型!拥有 DeepSeek R1 + V3 两者的优点📢 德国团队 tngtech 在HuggingFace 开源了新模型 DeepSeek R1T Chimera(规模 685B)
这个Chimera模型厉害了!它是通过合并 DeepSeek V3-0324 和 R1 这两个优秀的模型得到的。更惊喜的是,它竟然减少了 40% 的 tokens!🤯
最最重要的是,官方宣称这次的 token 缩减完全没有性能损失!😱 这就非常炸裂了!想象一下,用更少的 token 就能达到 R1 效果,直接起飞!🚀
而且,DeepSeek R1T Chimera 还是 MIT 许可的!🔥 这就意味着我们可以更自由地研究和使用它,对于开发者和研究人员来说,简直是打开了一扇新的大门!
🔮 大家对这个新的Chimera模型有什么看法呢?快在评论区一起探讨吧!
2025-05-03
浏览91
每日精选
登录后评论
评论
分享