δ-mem用8×8矩阵换长上下文 (opens in new tab)
δ-mem外挂8×8状态矩阵 :frozen主干不变、delta-rule在线更新,记忆密集任务上较基线提升10–15%,把长上下文从「扩窗口」重新表述为「设计状态机」|AI论文简报
Read the original articleδ-mem外挂8×8状态矩阵 :frozen主干不变、delta-rule在线更新,记忆密集任务上较基线提升10–15%,把长上下文从「扩窗口」重新表述为「设计状态机」|AI论文简报
Read the original article