96SEO 2026-02-19 18:24 8
。

但因为公司的业务需求#xff0c;我意外参与并主导了公司内部开源时序数据库influxdb的引擎改造#xff0c;所以我也就顺理成章的成为时序数据库“从业者”。
其实我之前是不太了解时序数据库以及它相关的机制的只是大概知晓它的用途。
但因为公司的业务需求我意外参与并主导了公司内部开源时序数据库influxdb的引擎改造所以我也就顺理成章的成为时序数据库“从业者”。
造飞机的人需要时刻理解开飞机的人的需求。
我不算时序数据库的使用者但我想站在用户的角度去思考他们需要一款怎样的“时序数据库”我司的influxdb的第一阶段改造已经完成所以我写下这篇文章总结一下自己在开发中的一些思考与想法。
也许有些地方还不够成熟但胜在人会慢慢进步。
Prometheus、Influxdb和opentsdb是三款业内比较知名且实际生产使用的时序数据库了总的来说三款各有优缺点这里不谈它们的性能主要谈谈使用和生态。
Influxdb目前开源排名最高的时序数据库是单独的数据库主要就是用来写入和查询数据。
目前集群版已经闭源商业化开源版仅支持单机模式。
数据采集使用push模式数据源主动将数据写入influxdb。
优势是提供类SQL的查询引擎。
InfluxDB在DB-Engines的时序数据库排名中遥遥领先
Prometheus提供了一整套的监控体系包括数据的采集存储报警等。
仅支持单机数据写入本地。
数据采集使用的是pull模式。
opentsdb基于hbase做的时序数据库最大的特点是由hbase带来的横向扩展能力最大的缺点是hbase带来的笨拙感一旦集群扩大运维可能会烦死人。
公司内部团队曾经用mysql中间件做过一款伪时序数据库但是由于mysql底层的存储形式导致其天然不适应时序数据的场景。
且其写入能力也完全无法满足时序数据大量写入的要求。
2、持续高并发写入设备越多写入数量越大而且由于定期采样写入量平稳。
但是几乎不会有更新操作一个设备在某个时间点产生的数据不会变动以及单独数据点的删除通常只会删除过期时间范围内所有的数据
4、设备之间的数据关联性小同种类设备A和设备B产生的数据互相并不依赖。
你并不需要join。
由上述特点结合我与iot行业相关人员的探讨我总结出以下时序数据库要解决的痛点
3、能够方便的剔除过期数据或者能够把数据冷热分离以降低存储成本
4、传统企业it人员专业素质不高带来的对整个时序数据库体系的易用性要求
Tree。
更妙的是时序数据很少有更新、删除操作对事物的需求也不高这很好的规避了LSMT对于update和delete上的缺陷。
市面上的时序数据库基本都是采用LSM
关于数据的压缩很容易的能想到同纬度的数据压缩时间戳前缀压缩等想法这些在各家数据库都有体现。
当然opentsdb似乎由于底层的hbase无法更好的针对时序数据的特点进行压缩与之类似的问题是opentsdb必须手动去根据时间段来管理数据而Influxdb、Prometheus包括Graphite等都是可以自己根据时间段来分割数据的。
这样当你要删除过期数据时只要删除对应的block就行。
对于数据查询经常有人吐槽SQL不太行所以有后面的NO-SQL出现。
但是当大家真的想去做些分析时还是不由自主的想念SQL想在KV上用上SQLnew
sql哈哈哈SQL真香。
所以好的内置的针对时序数据的sql引擎也是让人感到愉悦、不可缺少的东西。
目前Influxdb在这一块大大领先。
如果你想长时间保存数据一个比较麻烦的问题是单机总是有容量上限的即使你做一个上层中间件来搞一个所谓的集群。
另外关于高可用坏盘、数据迁移等等是真实的让人头痛的东西我个人比较反感简单的双写毕竟你要浪费两倍的CPU和内存LSMT的Compaction带来的写放大本来就让人头疼你还要对你的数据做两次OMG李佳琦脸真让人接受不能。
在数据库领域只要你上生产你就得考虑HA、数据可靠性你就得考虑你的运维难度和成本否则性能再高也只是个PPT产物。
在时序数据库这一块我讨厌简单的双写同时我对于上层弄个一致性协议去搞所谓的分布式不是很感冒只要数据要同时处理解压压缩多次的都挺浪费的。
你也可以选择分库分表分设备但是底层似乎也是单点的且单点上也要做主备emmm。
我认为计算存储分离是个好方向。
底层存储像hdfs一样数据写解压、压缩一次剩下两份直接副本传输或者做EC,美妙。
显著的好处是对同一份数据的compaction肯定只要做一次读取-compaction-写入文件-副本拷贝而且免去了坏盘物理机down等的烦恼。
数据扩容/冷热分离也较为方便。
同时对于一写多读相对友好类似阿里的Polardb
缺点嘛多个计算节点写同一份数据比较麻烦需要分布式锁来同步不过在iot下设备天然可分割设备区1的设备数据无需与设备区2的监控等数据做join等那么为什么不能把无瓜葛的设备数据写在不同的实例里呢这样似乎能较好的缓解写入的压力。
另一种形式的分库分表
时序数据库确实在iot/监控这一方面是专精的其在时序数据写入/查询/数据压缩方面有巨大的优势能够解决许多用户痛点。
而现有的时序数据库在存储方面还有所不足要么是单机的要么难以维护opentsdb)。
可改造的地方还有很多。
不过更高的查询性能更快的写入速度更方便低成本的运维人人想要。
一旦业务规模上来各方面的需求都应该且会被考虑到却并不可能都被满足。
做工程本质上还是不断地做Trade
作为专业的SEO优化服务提供商,我们致力于通过科学、系统的搜索引擎优化策略,帮助企业在百度、Google等搜索引擎中获得更高的排名和流量。我们的服务涵盖网站结构优化、内容优化、技术SEO和链接建设等多个维度。
| 服务项目 | 基础套餐 | 标准套餐 | 高级定制 |
|---|---|---|---|
| 关键词优化数量 | 10-20个核心词 | 30-50个核心词+长尾词 | 80-150个全方位覆盖 |
| 内容优化 | 基础页面优化 | 全站内容优化+每月5篇原创 | 个性化内容策略+每月15篇原创 |
| 技术SEO | 基本技术检查 | 全面技术优化+移动适配 | 深度技术重构+性能优化 |
| 外链建设 | 每月5-10条 | 每月20-30条高质量外链 | 每月50+条多渠道外链 |
| 数据报告 | 月度基础报告 | 双周详细报告+分析 | 每周深度报告+策略调整 |
| 效果保障 | 3-6个月见效 | 2-4个月见效 | 1-3个月快速见效 |
我们的SEO优化服务遵循科学严谨的流程,确保每一步都基于数据分析和行业最佳实践:
全面检测网站技术问题、内容质量、竞争对手情况,制定个性化优化方案。
基于用户搜索意图和商业目标,制定全面的关键词矩阵和布局策略。
解决网站技术问题,优化网站结构,提升页面速度和移动端体验。
创作高质量原创内容,优化现有页面,建立内容更新机制。
获取高质量外部链接,建立品牌在线影响力,提升网站权威度。
持续监控排名、流量和转化数据,根据效果调整优化策略。
基于我们服务的客户数据统计,平均优化效果如下:
我们坚信,真正的SEO优化不仅仅是追求排名,而是通过提供优质内容、优化用户体验、建立网站权威,最终实现可持续的业务增长。我们的目标是与客户建立长期合作关系,共同成长。
Demand feedback