漫卷
RWKV7-G0a3 7.2B发布:迄今最强RNN,高并发vibe coding 








2025 年 10 月 30 日, RWKV7-G0a3 7.2B 推理模型开源发布。它基于 RWKV7-G0a2 7.2B 继续训练高质量数据,显著提升能力。
💡Tips RWKV 模型名称的 G1/G1a/G1a2/G0a3 等字段是训练数据的版本,数据质量 G#a3 > G#a2 > G#a > G#,数据数量 G1 > G0。简单规则:同一参数选择最新的模型,效果最好。
模型性能评估
MMLU & MMLU PRO
评估模型在多学科知识的综合能力(MMLU PRO 难度比 MMLU 更高)。
GSM8K
评估模型在中学难度数学应用题的推理能力。
MATH500
测试模型在更难数学问题的解题能力。
CEval
以多行业真实试题,评估模型中文理解和专业知识。
模型实战
我们使用上次测试的 prompt:请生成一个蓝紫色主题(主色调为 #6A5ACD,辅助色为白色)的现代用户卡片组件。卡片内必须包含:1. 用户头像(圆形占位符);2. 用户名;3. 一句签名(使用斜体字);4. 一个蓝色关注按钮;5. 整体 布局居中。
上次的第二个 vibe coding prompt:请给前沿科技媒体机器之心设计一个前沿风格网页,要求置顶部分滚动播出实时AI新闻。在抽卡几次后,G0a3 成功实现了滚动文字。
第三个 vibe coding prompt:请生成精美的HTML网页:鲁迅纪念馆
尝试更详细的 prompt: 请生成一个主题为“鲁迅纪念馆”的精美 HTML 网页,要求:* 包含顶部导航、横幅、展览介绍、鲁迅生平时间线、代表作品、纪念照片墙、参观信息、页脚 * 网页整体要符合纪念馆庄重、文化的气质,G0a3 模型遵循了指令:
💡Tips所有生成的代码都在文末附录。我们会持续发布 vibe coding 能力显著更强的模型。
效果预览:
小说和故事创作
💡Tips 创作任务推荐的解码参数:Temperature=0.6,Top_P=0.7,Presence Penalty=2,Frequency Penalty=0.2
我们在新模型主蒸 DeepSeek v3.1,可以看到它的显著风格:
模型下载
如何使用 RWKV 模型
加入 RWKV 社区
欢迎大家加入 RWKV 社区,可以从 RWKV 中文官网了解 RWKV 模型,也可以加入 RWKV 论坛、QQ 频道和 QQ 群聊,一起探讨 RWKV 模型。
- 下载图片
- 复制图片
2025-11-03
浏览568
登录后评论
4
评论
分享
