96SEO 2026-06-06 01:17 2
这prompt怎么生成7万字了?
说实话,这事儿一开始我也没想到。咱就是说本来只是想写个简单的prompt,结果写着写着就收不住了你懂的,那种灵感来了挡dou挡不住的感觉。不对不对,应该是说这玩意儿怎么就长成这样了?
害,这事儿吧,说来话长。一开始,我就是想搞个分类模型,给短信打个标签,抽个字段啥的。结果呢,越写越嗨,规则引擎、实体抽取、融合决策、SQLite存储、前端页面……一套组合拳下来代码量直接干到7万字。这哪是写prompt啊,这简直是在造轮子!

不过你别说这轮子造得还挺结实。咱们这个“短信智标官”项目,从头到尾dou是按工程化来搞的,目录结构清清楚楚,代码模块划分得明明白白。你kan这目录树,是不是有点像模像样了?
项目目录树sms-tagging-officer/
├── README.md
├── package.json
├── pnpm-lock.yaml
├── pnpm-workspace.yaml
├── tsconfig.json
├── vite.config.ts
├── .env.example
├── /apps/desktop/
│ ├── index.html
│ ├── src/
│ │ ├── main.ts
│ │ ├── App.vue
│ │ ├── router.ts
│ │ ├── api/tauri.ts
│ │ ├── api/types.ts
│ │ ├── api/schema.ts
│ │ ├── stores/settings.ts
│ │ ├── stores/batch.ts
│ │ ├── utils/validators.ts
│ │ ├── utils/sample.ts
│ │ ├── pages/
│ │ │ ├── ImportPage.vue
│ │ │ ├── BatchPage.vue
│ │ │ ├── ListPage.vue
│ │ │ ├── ExportPage.vue
│ │ │ └── SettingsPage.vue
│ │ └── components/
│ │ ├── ColumnMapper.vue
│ │ ├── MessageTable.vue
│ │ ├── ReviewDrawer.vue
│ │ ├── FilterBar.vue
│ │ └── ProgressPanel.vue
├── /src-tauri/
│ ├── Cargo.toml
│ ├── tauri.conf.json
│ ├── build.rs
│ ├── src/
│ │ ├── main.rs
│ │ ├── commands.rs
│ │ ├── domain/
│ │ │ ├── schema.rs
│ │ │ ├── enums.rs
│ │ │ └── dto.rs
│ │ ├── infra/
│ │ │ ├── log.rs
│ │ │ └── time.rs
│ │ ├── db/
│ │ │ ├── mod.rs
│ │ │ ├── migrations.sql
│ │ │ └── dao.rs
│ │ ├── rules/
│ │ │ ├── mod.rs
│ │ │ ├── extractor.rs
│ │ │ ├── signals.rs
│ │ │ └── rule_engine.rs
│ │ ├── providers/
│ │ │ ├── mod.rs
│ │ │ ├── provider.rs
│ │ │ ├── llama_cpp.rs
│ │ │ └── prompt.rs
│ │ ├── fusion/
│ │ │ ├── mod.rs
│ │ │ └── decision.rs
│ │ └── batch/
│ │ ├── mod.rs
│ │ └── worker.rs
├── /assets/
│ ├── sample_messages.csv
│ ├── sample_messages.jsonl
│ └── json_schema_output.json
└── /vendor/
└── llama/
├──
└── README-LLAMA.md
你kan这结构,是不是有点像那么回事了?从目录到模块,从后端到前端,一应俱全。咱们这个项目,主打一个“离线短信分类打标”,名字我dou想好了就叫“短信智标官”!
Schema 与枚举常量文件先说说这个 schema 和枚举常量文件,这玩意儿是整个系统的基础,就像盖楼的地基一样,必须得稳。
行业分类:
金融
通用
政务
渠道
互联网
其他
短信类型:
验证码
交易提醒
账单催缴
保险续保
物流取件
会员账号变geng
政务通知
风险提示
营销推广
其他
这些枚举值,就是咱们系统里的“标准答案”,模型和规则dou得照着这个来。你懂的,不Neng乱来不然Zui后输出的标签就乱套了。
然后是实体抽取,比如验证码、金额、链接、品牌啥的,这些dou得从短信里抽出来。你kan,这不就是个结构化的过程嘛,把非结构化的短信变成结构化的数据,方便后续分析。
规则提取器与测试样例规则提取器这块,咱们是用正则表达式来搞的。比如验证码,就用正则匹配“验证码”、“校验码”、“动态码”这些关键词,再提取后面的数字。物流取件也是匹配“取件”、“驿站”这些词。政务通知就匹配“政务”、“公安”、“税务”这些关键词。
你kan,这不就是规则引擎嘛,简单粗暴,但效果拔群。而且,规则引擎还有一个好处,就是可解释性强。比如它Neng告诉你为啥这条短信被判定为“验证码”,因为它匹配到了“验证码”关键词和一个6位数字。
测试样例也得有,比如:
您尾号1234卡于2026-01-01 12:58消费58.20元,余额1020.55元。
验证码123456,用于登录验证,5分钟内有效。
快件Yi到达XX驿站,取件码123456,请于18:00前取走。
这些样例覆盖了各种场景,保证咱们的规则引擎Neng准确命中。
llama.cpp 推理 Provider 与分类 Prompt规则引擎兜底,模型来补全。这就是咱们的策略。规则引擎先把强模式的给识别出来比如验证码、物流取件这些。剩下的,就交给模型来处理。
模型这块,咱们用的是 llama.cpp,完全离线运行,不联网,不上传数据,安全又可靠。你懂的,现在这数据安全,比啥dou重要。
模型的输入,就是短信内容、规则层提取的实体和信号。输出呢,就是行业大类、短信类型、置信度、原因解释啥的。而且,输出必须是严格 JSON,字段齐全,不Neng有遗漏。
你kan,这不就是个典型的“规则+模型”协同工作的例子嘛。规则负责快准狠,模型负责补全和兜底。这俩一结合,效果直接拉满。
融合决策器规则和模型dou输出了结果,那听谁的呢?这就得靠融合决策器了。
规则强命中,比如验证码,直接用规则的输出。规则没命中的,就用模型的输出。Ru果规则和模型冲突了比如规则提取到了验证码,但模型判断为“其他”,那就得进入复核队列,人工来判断。
这融合决策器,就是个“裁判”,负责在规则和模型之间Zuo仲裁。它Neng保证输出结果的准确性和一致性,还Neng把难例挑出来让人工复核,提高整体效率。
SQLite 初始化脚本与 DAO 层数据存储这块,咱们用的是 SQLite,轻量、方便、跨平台。你懂的,桌面应用嘛,SQLite 是首选。
数据库里至少三张表:
messages存原始短信和元信息
labels存模型输出标签和抽取字段
audit_logs记录人工改动前后差异和操作者信息
任何人工修改dou必须落审计日志,这可是合规的底线。查询和过滤Neng力也得有,按行业、类型、置信度啥的筛选,复核效率直接翻倍。
前端页面与核心组件前端用的是 Tauri + Vue3 + TS,界面简洁明了。导入页、批处理页、列表页、导出页、设置页,一应俱全。
导入页支持 CSV/Excel 列映射,批处理页有进度条、失败计数、重试按钮。列表页一眼就Nengkan到短信内容、标签、置信度、关键实体。复核抽屉支持直接修改标签和实体,并自动落审计日志。
你kan,这不就是一套完整的桌面应用嘛。从导入数据到批处理,再到人工复核,Zui后导出结果,一气呵成。
README 与运行说明Zui后咱们还得有个 README,把怎么跑这个项目说清楚。比如:
怎么安装依赖
怎么配置模型路径
怎么导入数据
怎么跑批处理
怎么复核和导出
把这些dou写清楚了用户就Neng照着文档一步步跑通整个流程。你懂的,文档写得好,用户少烦恼。
这项目从头到尾,dou是按工程化来搞的。代码结构清晰,模块划分明确,文档说明详细。虽然代码量有点大,但每一行dou是为了把这事儿搞明白。你kan这“7万字”,是不是有点“大作”那味儿了?哈哈。
作为专业的SEO优化服务提供商,我们致力于通过科学、系统的搜索引擎优化策略,帮助企业在百度、Google等搜索引擎中获得更高的排名和流量。我们的服务涵盖网站结构优化、内容优化、技术SEO和链接建设等多个维度。
| 服务项目 | 基础套餐 | 标准套餐 | 高级定制 |
|---|---|---|---|
| 关键词优化数量 | 10-20个核心词 | 30-50个核心词+长尾词 | 80-150个全方位覆盖 |
| 内容优化 | 基础页面优化 | 全站内容优化+每月5篇原创 | 个性化内容策略+每月15篇原创 |
| 技术SEO | 基本技术检查 | 全面技术优化+移动适配 | 深度技术重构+性能优化 |
| 外链建设 | 每月5-10条 | 每月20-30条高质量外链 | 每月50+条多渠道外链 |
| 数据报告 | 月度基础报告 | 双周详细报告+分析 | 每周深度报告+策略调整 |
| 效果保障 | 3-6个月见效 | 2-4个月见效 | 1-3个月快速见效 |
我们的SEO优化服务遵循科学严谨的流程,确保每一步都基于数据分析和行业最佳实践:
全面检测网站技术问题、内容质量、竞争对手情况,制定个性化优化方案。
基于用户搜索意图和商业目标,制定全面的关键词矩阵和布局策略。
解决网站技术问题,优化网站结构,提升页面速度和移动端体验。
创作高质量原创内容,优化现有页面,建立内容更新机制。
获取高质量外部链接,建立品牌在线影响力,提升网站权威度。
持续监控排名、流量和转化数据,根据效果调整优化策略。
基于我们服务的客户数据统计,平均优化效果如下:
我们坚信,真正的SEO优化不仅仅是追求排名,而是通过提供优质内容、优化用户体验、建立网站权威,最终实现可持续的业务增长。我们的目标是与客户建立长期合作关系,共同成长。
Demand feedback