利用相邻层 top-K 索引的 70-100% 重叠,让 3/4 的 Transformer 层跳过 indexer 计算
用一个便宜的打分器为每个 query 挑出最相关的 key——比固定窗口准,比 dense 省