96SEO 2026-05-26 05:48 0
Hermes接LiteLLM缓存为何不生效?深度解析及解决方案
Zui近在使用Hermes Agent过程中遇到一个奇怪的问题:尽管Hermes Agent和Claude Codedou连接同一个LiteLLM网关,使用AWS Bedrock的Claude模型,但Hermes的请求费用却比Claude Code贵了近一倍。经过深入调查,发现问题根源在于api_mode配置不当,导致Prompt Cache未被启用。
我的Hermes Agent和Claude Codedou配置了相同的LiteLLM网关,后者底层使用AWS Bedrock的Claude模型。Hermes使用Sonnet模型,而Claude Code使用Opus模型。尽管Opus的定价比Sonnet高,但在实际使用中,Hermes的每次请求费用却远超Claude Code。

数据统计显示,Hermes的输入token数量少于Claude Code,但单次请求的费用却高出近一倍。进一步查kan缓存命中率,发现两者存在显著差异:Hermes: 0% vs Claude Code: 73%。这表明Hermes的缓存机制并未生效。
查kan~/.hermes/config.yaml配置文件,发现provider: custom,且base_url指向LiteLLM网关地址。Hermes内部的determine_api_mode方法根据base_url推断API模式,由于未命中特殊规则,默认返回chat_completions。
在OpenAI兼容模式下is_anthropic_wire = False,导致被返回,进而使得cache_control字段未被添加到请求中。因此,LiteLLM网关收到的请求中没有包含缓存控制信息,导致缓存未被触发。
api_mode配置详解
api_mode是Hermes决定使用哪种wire protocol与API通信的关键配置项。它有四个合法值:
chat_completions: OpenAI兼容模式,使用/v1/chat/completions端点。
anthropic_messages: Anthropic原生模式,使用/v1/messages端点,支持Prompt Cache等Anthropic特性。
bedrock_converse: AWS Bedrock Converse API格式,直接对接AWS Bedrock。
codex_responses: OpenAI Responses API格式,用于支持Responses API的端点。
Hermes默认采用chat_completions模式,但当使用Anthropic模型时需要显式指定api_mode: anthropic_messages以启用Prompt Cache等特性。
为了解决缓存不生效的问题,需要修改~/.hermes/config.yaml配置文件,增加配置项,并调整base_url 以匹配LiteLLM网关地址。
# ~/.hermes/config.yaml
model:
default: claude-sonnet-3.5-20240620
provider: custom
base_url: https://api.huancode.com
api_key: ${HUNCODE_API_KEY}
api_mode: anthropic_messages # ← 新增配置项
修复后通过查kanLiteLLM日志中的 request_tags 字段,Ke以验证 cache_control 字段Yi被正确添加。同时缓存命中率显著提升,与Clade Code持平。
根据估算,在同等命中率下每次请求的费用从$0.149降至约$0.041,整体节省约72%。这表明,通过正确配置 api_mode 并启用Prompt Cache,Ke以显著降低请求成本。
在使用Hermmes连接LiteLLM时必须注意 api_mode 的配置,以确保正确的API协议被采用。对于Anthropic模型,显式指定 api_mode: anthropic_messages 是启用Prompt Cache的关键。此外了解不同API模式的特点及其适用场景,有助于优化请求性Neng和降低成本。
通过深入分析问题根源,并采取针对性的配置调整,我们成功解决了Hermmes接LiteLLM时缓存不生效的问题,为用户带来了显著的成本节约和性Neng提升。这一经验也提醒我们在使用类似工具时需仔细核对配置细节,以充分发挥其潜力。
此文结合了技术细节与实际案例分析,既阐述了问题的来龙去脉,也提供了具体的解决方案,具有较强的实用性和参考价值。通过SEO优化,可提高文章在相关技术领域的可见度。
作为专业的SEO优化服务提供商,我们致力于通过科学、系统的搜索引擎优化策略,帮助企业在百度、Google等搜索引擎中获得更高的排名和流量。我们的服务涵盖网站结构优化、内容优化、技术SEO和链接建设等多个维度。
| 服务项目 | 基础套餐 | 标准套餐 | 高级定制 |
|---|---|---|---|
| 关键词优化数量 | 10-20个核心词 | 30-50个核心词+长尾词 | 80-150个全方位覆盖 |
| 内容优化 | 基础页面优化 | 全站内容优化+每月5篇原创 | 个性化内容策略+每月15篇原创 |
| 技术SEO | 基本技术检查 | 全面技术优化+移动适配 | 深度技术重构+性能优化 |
| 外链建设 | 每月5-10条 | 每月20-30条高质量外链 | 每月50+条多渠道外链 |
| 数据报告 | 月度基础报告 | 双周详细报告+分析 | 每周深度报告+策略调整 |
| 效果保障 | 3-6个月见效 | 2-4个月见效 | 1-3个月快速见效 |
我们的SEO优化服务遵循科学严谨的流程,确保每一步都基于数据分析和行业最佳实践:
全面检测网站技术问题、内容质量、竞争对手情况,制定个性化优化方案。
基于用户搜索意图和商业目标,制定全面的关键词矩阵和布局策略。
解决网站技术问题,优化网站结构,提升页面速度和移动端体验。
创作高质量原创内容,优化现有页面,建立内容更新机制。
获取高质量外部链接,建立品牌在线影响力,提升网站权威度。
持续监控排名、流量和转化数据,根据效果调整优化策略。
基于我们服务的客户数据统计,平均优化效果如下:
我们坚信,真正的SEO优化不仅仅是追求排名,而是通过提供优质内容、优化用户体验、建立网站权威,最终实现可持续的业务增长。我们的目标是与客户建立长期合作关系,共同成长。
Demand feedback