Talon
使用场景 chevron_right RAG 混合检索
compare_arrows HYBRID SEARCH ENGINE

企业级知识库 RAG 混合检索流程

融合 BM25 关键词匹配与 HNSW 向量语义搜索,通过 RRF 算法决策级排序,解决专有名词与语义歧义问题。

inventory_2 预处理管道

文档输入 CHUNKING
向量化 EMBEDDING

text-embedding-3-large

索引写入 INDEXING

自动构建并行索引结构

search
USER QUERY
"Talon RAG 系统的延迟是多少?"
find_in_page

全文搜索 [FTS]

Algorithm BM25 / TF-IDF
Tokenizer Jieba / IK
Feature 高精度词频命中
"Talon" "延迟" "是"
hub

向量搜索 [Vector]

Index HNSW / IVF
Metric cosine_similarity
Feature 高召回语义匹配
0.892
merge

RRF 权重融合排序

FUSE FORMULA
1 / (k + rank_i)
Top K
3x rerankers
Final Result
optimized list
search_query.sql
SELECT * FROM hybrid_search(
    query_text => 'Talon RAG 系统的延迟是多少?',
    vector_col => 'embedding',
    fts_col => 'content_tsvector',
    limit_n => 10,
    rrf_k => 60,
    alpha => 0.5  -- balance keyword vs semantic weight
);

准备好构建您的企业 RAG 管道了吗?