compare_arrows HYBRID SEARCH ENGINE
企业级知识库 RAG 混合检索流程
融合 BM25 关键词匹配与 HNSW 向量语义搜索,通过 RRF 算法决策级排序,解决专有名词与语义歧义问题。
inventory_2 预处理管道
文档输入 CHUNKING
向量化 EMBEDDING
text-embedding-3-large
索引写入 INDEXING
自动构建并行索引结构
search
USER QUERY
"Talon RAG 系统的延迟是多少?"
find_in_page
全文搜索 [FTS]
Algorithm BM25 / TF-IDF
Tokenizer Jieba / IK
Feature 高精度词频命中
"Talon" "延迟" "是"
hub
向量搜索 [Vector]
Index HNSW / IVF
Metric cosine_similarity
Feature 高召回语义匹配
merge
RRF 权重融合排序
FUSE FORMULA
1 / (k + rank_i)
Top K
3x rerankers
Final Result
optimized list
SELECT * FROM hybrid_search(
query_text => 'Talon RAG 系统的延迟是多少?',
vector_col => 'embedding',
fts_col => 'content_tsvector',
limit_n => 10,
rrf_k => 60,
alpha => 0.5 -- balance keyword vs semantic weight
);