布帛矛
北大高精度可扩展求解器算法设计
1 算法框架与迭代流程
研究团队基于迭代算法,结合了模拟低精度矩阵求逆和模拟高精度矩阵-向量乘法运算,开发了一种基于全模拟矩阵运算的高精度矩阵方程求解方案。该算法的核心思想是将高精度问题分解为低精度求解和高精度校正的组合,既保持了模拟计算的高效率,又实现了数字计算的精度。
算法框架如下:
1. 初始近似:利用模拟低精度矩阵求逆电路快速获得矩阵方程的初始近似解。这一步虽然精度有限,但速度极快,为后续迭代提供了良好的起点。
2. 迭代细化:通过高精度模拟矩阵-向量乘法计算残差,并利用低精度求逆电路更新解向量,逐步提高解的精度。
特别需要注意的是,模拟矩阵求逆有助于减少迭代次数,因为该方法可以在每次迭代中提供近似正确的结果。而高精度模拟矩阵-向量乘法通过位切片方法,实现迭代细化过程。
2 精度提升策略
2.1 位切片技术
团队创新采用纯模拟"位切片"技术:将24位精度数字拆解为多个3位片段,分配至不同RRAM阵列并行运算,最终叠加整合结果。这种"分而治之"的策略,使模拟电路从处理"儿童简笔画"的水平,跃升至可绘制"超写实油画"的高精度级别。
位切片技术的实现依赖于RRAM器件的多级存储特性。研究团队在40nm CMOS工艺平台制造的RRAM阵列可实现3比特电导态编程,这为位切片提供了硬件基础。通过精确控制RRAM的电阻状态,使其表示不同的位权值,最终通过电流叠加实现高精度计算。
2.2 迭代细化算法
迭代细化是保证最终精度的关键环节。研究表明,矩阵方程求解经过10次迭代后,相对误差可低至10⁻⁷量级。这一精度已经达到甚至超过了许多数字计算方法的精度水平。
迭代细化过程的数学基础是残差校正。设待求解的矩阵方程为Ax=b,迭代过程如下:
1. 计算残差 r = b - Axₖ
2. 求解校正量 Δx = A⁻¹r
3. 更新解 xₖ₊₁ = xₖ + Δx
在模拟计算中,步骤2通过低精度模拟矩阵求逆电路实现,虽然求逆本身精度有限,但迭代过程的收敛性保证了最终解的高精度。
3 可扩展性设计
3.1 块矩阵方法
研究团队提出了块矩阵模拟计算方法,像拼图一样将大问题分解到多个芯片上协同解决,成功突破了模拟计算的规模限制。通过与块矩阵算法相结合,研究团队在实验上成功实现了16×16矩阵的24比特定点数精度求逆。
块矩阵方法将大规模矩阵分割为较小的子矩阵,每个子矩阵映射到独立的RRAM阵列上进行计算,最后通过电路连接整合各部分结果。这种方法不仅解决了硬件规模限制,还提高了计算并行度。
3.2 全模拟路径设计
与传统的数模混合方案不同,北大团队坚持全模拟计算路径,避免了频繁的模数转换操作。传统数模混合方案虽可借助浮点数字计算机实现高精度残差计算,却大幅削弱了模拟计算在降低复杂度方面的核心优势。
全模拟路径的优势在于保持了模拟计算的低延迟特性,避免了模数转换带来的性能瓶颈。同时,全模拟计算还显著降低了功耗,为能效提升做出了重要贡献。
- 下载图片
- 复制图片
2025-10-15
浏览18
新闻聊天
登录后评论
1
评论
1
