1 篇文档带有标签「kernel-feature-map」

线性注意力与 SSM

不再做两两内积 + softmax，改用核函数或状态空间递推，把序列写成固定大小的前缀状态