96SEO 2026-06-14 16:11 2
嘿,老铁们!今天聊聊怎么把 RAG跑得稳稳的,别说我没提醒你,召回、重排、上下文预算三块要一起打平。
召回这一步:先把所有可Neng的证据dou揪出来想象你在找老朋友的联系方式。先把所有社交平台dou搜索一下再合并去重。RAG 也一样。

我们常用两条通道:关键词检索和向量检索。 关键词是硬匹配——精确实体、订单号、品牌名。 向量是软匹配——语义相近、同义词、口语化表达。
关键点是不要把两条通道拼成一堆乱序的列表。先拿到候选后要Zuo合并去重,再交给 Rerank Zuo精排。
ES 召回代码小示例const esHits = await esClient.search({
index: 'knowledge',
size: kEach,
query: {
multi_match: {
query: q,
fields: ,
type: 'best_fields',
analyzer: 'ik_smart'
}
}
});
Milvus 向量检索小示例
const milvusHits = await milvus.similaritySearch;
去重与合并:让同一条证据只出现一次
Ru果 ES 和 Milvus dou返回同一篇文章,那就只保留一次节省上下文窗口。
function dedupeDocs {
const seen = new Set;
return docs.filter(d => {
const id = d.metadata.id;
if ) return false;
seen.add;
return true;
});
}
为什么百度不收录?
哈哈,你问这个,其实跟 RAG 没啥直接关系。说个小故事:我之前写了一篇技术博客,标题叫《如何有效管理 RAG 的召回、重排与上下文预算?》结果根本没被百度收录。原因hen简单——内容太专业,缺少人类可读的关键字,而且我忘了给页面加 meta 标签。再说一句:别光靠技术细节,还要考虑 SEO。
Rerank:从候选中挑出Zui靠谱的那几条Deno/Node 上跑 DashScope 或者 OpenAI 的 reranker 模型吧。它会把用户原始问题 + 每个候选文档一起喂进去,让模型直接判断“这段文本Neng回答吗”。
const topDocs = await reranker.compressDocuments;
记住:Rerank 并不是万Neng清洗器,它只负责排序。Ru果第一阶段召回Yi经跑偏,那 Rerank Neng选到相对好一点,但根本还是缺少证据。
小技巧:给每个通道加权比单纯拼接geng靠谱ID 值保持一致非常重要;否则去重会失效,还会导致日志难追踪。
上下文预算:LLM 的窗口有限,别塞满了无用词Llama / ChatGPT 等大模型往往有4k /8k token 限制。我们要控制 TopN 的大小,让模型只吃Zui干净的证据。
#1 把 ES 和 Milvus 的结果合并后用 Rerank 精排到前10条。
#2 再对这10条Zuo一次摘要或压缩,只保留关键信息。
#3 Zui后把压缩后的文本放进 prompt,确保 LLM 有足够上下文但不被噪声淹没。
实现代码片段function buildContext {
return docs.map=>` ${d.pageContent}`).join;
}
const contextStr = buildContext;
const prompt = `
你是一个知识库助手。
请根据以下文本回答用户的问题:
${contextStr}
用户问题:${query}
`;
const answer = await llm.generate;
一下步骤:
#1 用户输入 → Query Augmentation.
#2 多角度查询分别跑 ES 与 Milvus.
#3 合并去重 → 得到 rawCandidates.
#4 Rerank 精排 → topK 文档.
#5 上下文预算控制 → 减少噪声.
#6 LLM 用Zui终上下文生成答案.
常见坑点 & 小提醒:
- 不要让 过多导致核心实体消失; 只Neng补全缺失信息,而不是变形原意。
- 确保每个通道返回的 Document dou带上业务 ID,否则去重无效。
- 超时降级hen重要,一旦 Rerank 超时Ke以直接返回未排序候选或“暂无答案”。
Zui后一句话,咱们团队Zui近遇到一个问题:在生产环境里上下文窗口突然变窄导致答案质量下降。原因是我们把每个请求dou塞进同一个 Redis 缓存里没有分隔不同查询,会造成缓存污染。所以记得使用独立键或前缀区分不同用户/请求,这样才不会互相影响哟!哈哈~
作为专业的SEO优化服务提供商,我们致力于通过科学、系统的搜索引擎优化策略,帮助企业在百度、Google等搜索引擎中获得更高的排名和流量。我们的服务涵盖网站结构优化、内容优化、技术SEO和链接建设等多个维度。
| 服务项目 | 基础套餐 | 标准套餐 | 高级定制 |
|---|---|---|---|
| 关键词优化数量 | 10-20个核心词 | 30-50个核心词+长尾词 | 80-150个全方位覆盖 |
| 内容优化 | 基础页面优化 | 全站内容优化+每月5篇原创 | 个性化内容策略+每月15篇原创 |
| 技术SEO | 基本技术检查 | 全面技术优化+移动适配 | 深度技术重构+性能优化 |
| 外链建设 | 每月5-10条 | 每月20-30条高质量外链 | 每月50+条多渠道外链 |
| 数据报告 | 月度基础报告 | 双周详细报告+分析 | 每周深度报告+策略调整 |
| 效果保障 | 3-6个月见效 | 2-4个月见效 | 1-3个月快速见效 |
我们的SEO优化服务遵循科学严谨的流程,确保每一步都基于数据分析和行业最佳实践:
全面检测网站技术问题、内容质量、竞争对手情况,制定个性化优化方案。
基于用户搜索意图和商业目标,制定全面的关键词矩阵和布局策略。
解决网站技术问题,优化网站结构,提升页面速度和移动端体验。
创作高质量原创内容,优化现有页面,建立内容更新机制。
获取高质量外部链接,建立品牌在线影响力,提升网站权威度。
持续监控排名、流量和转化数据,根据效果调整优化策略。
基于我们服务的客户数据统计,平均优化效果如下:
我们坚信,真正的SEO优化不仅仅是追求排名,而是通过提供优质内容、优化用户体验、建立网站权威,最终实现可持续的业务增长。我们的目标是与客户建立长期合作关系,共同成长。
Demand feedback