跳到主要内容
Tier6-Model
头脑风暴
COP
互联通信
问题追踪
通用知识库
其他
开发计划
refs
技术规格
验证
1 篇文档带有标签「flash-compressor」
查看所有标签
序列压缩注意力
沿序列方向把若干 token 的 KV 加权融合成一个压缩 entry,减少 entry 总数