稀疏搜索性能测试¶

zerodep sparse_search 与 rank-bm25 及 bm25s 的性能对比。

测试环境

实现¶

查询匹配少量文档——倒排索引 O(matched_docs) 优势最明显的场景。

语料规模	zerodep	rank-bm25	bm25s
200 文档	3.1 μs	101.9 μs	28.8 μs
1000 文档	3.0 μs	379.3 μs	26.7 μs

使用高频词匹配大量文档——numpy 向量化运算占优的场景。

语料规模	zerodep	rank-bm25	bm25s
1K 文档	4.44 ms	325.8 μs	44.7 μs
10K 文档	55.8 ms	3.87 ms	104.5 μs

在真实词频分布下使用稀有词查询。

语料规模	zerodep	rank-bm25	bm25s
1K 文档	17.5 μs	309.4 μs	52.8 μs
10K 文档	162.0 μs	3.25 ms	293.3 μs

语料规模	zerodep	rank-bm25	bm25s
1000 文档	137.6 ms	13.3 ms	47.7 ms

搜索性能取决于查询选择性。 对于选择性查询（匹配文档少），倒排索引提供 O(matched_docs) 遍历——显著快于 rank-bm25 的 O(N) 全量扫描。对于宽泛查询（匹配大量文档），numpy 后端库（bm25s、rank-bm25）凭借向量化数组运算更快。
小语料规模（< 1K 文档）下，三者均为亚毫秒级——对于搜索结果重排或 RAG 检索等典型场景，性能差异可忽略。
bm25s 在大语料宽泛查询场景扩展性最好，得益于稀疏矩阵运算，搜索耗时随语料规模增长缓慢。
索引速度：rank-bm25 最快（数据结构更简单）；bm25s 居中；zerodep 因三层倒排索引开销最慢。
排名正确性 已通过与 rank-bm25 的 BM25Okapi、BM25Plus、BM25L 三个变体各 8 组查询的排名顺序对比验证。
zerodep 零 pip 依赖，并提供 rank-bm25 和 bm25s 不具备的功能：BM25F 多字段搜索、动态增删改、元数据过滤、RRF/MMR、Bayesian 校准。

pip install pytest pytest-benchmark rank-bm25 bm25s
pytest sparse_search/test_sparse_search_benchmark.py --benchmark-only -v