跳到主要内容

1 篇文档带有标签「kernel-feature-map」

查看所有标签

线性注意力与 SSM

不再做两两内积 + softmax,改用核函数或状态空间递推,把序列写成固定大小的前缀状态