什么是持久化数据结构?
一、什么是持久化数据结构
持久化存储,其实主要是针对内存数据的,以典型的Redis来说,持久化存储主要有三种方式:
1、RDB
RDB: 保存某个时间点的全量数据快照
触发方式
1. save: 阻塞Redis的服务器进程,直到RDB文件被创建完毕
2. bgsave: fork出子进程来创建RDB文件,不阻塞服务器进程, lastsave 指令可以查看最近的备份时间
3. 根据redis.conf里的save m n配置定时触发(用的是BGSAVE)
4. 主从复制时,主节点自动触发
5. 执行debug relaod命令
6. 执行shutdown且没有开启AOF持久化
2、AOF
AOF: 增量存储命令
触发方式
1. BGREWRITEAOF: 增量追加命令
2. 根据redis.conf里的appendfsync配置定时触发
3. AOF文件重写
3、混合持久化
为解决AOF文件启动加载慢,不利于快速恢复的缺点,RedisV4.0提供了新的持久化方式——混合持久化。
混合持久化的文件内容: [RDB file][AOF tail]
持久化过程:
1. 将重写(rewrite)这一刻之前的数据做RDB快照处理
2. 将RDB快照内容和AOF增量命令先后写入新的AOF临时文件
3. 重写完成后,对AOF临时文件改名,并覆盖旧的AOF文件
在redis重启的时候,可以先加载RDB文件,然后再重放增量的AOF日志就可以完全替代之前的AOF全量文件重放,因此能大幅提高重启效率提高。
延伸阅读:
二、可持久化实际应用
1.几何计算
在几何计算中有许多离线算法,例如悬线扫描法,其基本策略是一次扫描后给出所有询问的回答,在时间复杂度分析相当优异。但在强迫在线的情况下,每次都要进行一次悬线扫描,询问操作的时间复杂度就从对数时间降为线性。
为了解决时间复杂度上的问题,在这里可以引入可持久化的思维。我们将扫描线的时间轴作为一个变动依据,持久化相关的结构,只要我们能将询问在对数时间内穿梭于这个时间轴,必能动态解决先前的问题。
2.字串处理
为了达到非常高效率的合并操作,防止大量重复性字串的生成伴随的效能退化,使得各方面的操作都能远低于线性操作。如C++中的rope就是一个可持久化的数据结构。不只是字串操作。若处理类型有大量重复操作,均可以考虑将数据结构进行可持久化处理,以达到压缩时间开支的效果。
3.版本回溯
实际上就是对应大部分的应用软体中的redo/undo。如果资料库/操作变动为了高效率操作而会配上复杂的结构(并不像 hash, set 反转操作只需要常数或对数时间),那么为了快速回推变动结果,持久化结构就是要减少 redo/undo 的花费。
资料库本身可以常数回推,纪录变动的部分情况即可。而应用层的计算,大部分实作都是砍掉快取,并且重新计算出一份新的结构,有时候回推的变动大小为 m,为了重新计算结构而消耗了 n + m n+mn+m,如果 n nn 和 m mm 的差距非常大,那连续回推的体感就很糟糕。

相关推荐HOT
更多>>
python正则表达式中的零宽断言
python正则表达式中的零宽断言1、概念有些元字符不匹配任何字符,只是简单的表示成功或失败,所以这些字符也叫零宽断言。2、符号举例(1)|或操作...详情>>
2023-11-14 11:35:03
python方法的绑定和未绑定
python方法的绑定和未绑定1、说明未绑定对象的方法:无self参数的方法,通过定义类调用函数,返回未绑定self的方法。绑定对象的方法:带self参...详情>>
2023-11-14 09:53:02
python海象运算符的使用
python海象运算符的使用1、在判断条件下允许操作。在一定程度上简化了代码,但降低了可读性。i=len((l:=[1,2,3]))#先对l进行赋值,在对i赋值whi...详情>>
2023-11-14 02:38:21
pythonelif语句报错是什么原因
python的else和elif语句也可以叫做子句,因为它们不能独立使用,两者都是出现在if、for、while语句内部的。else子句可以增加一种选择;而elif子...详情>>
2023-11-13 21:46:35热门推荐
技术干货






