数据保留时间窗口的使用

less than 1 minute read

背景

类似mongodb的rotate collate(设置表的上限容量、上限记录数,持续写入,自动覆盖最老的记录),PostgreSQL通过pipelinedb也能实现类似的功能。

此类功能非常适合日志数据,无需维护成本,持续写入,自动覆盖最老的记录。

pipelinedb计划会在2017-07月份转换为postgresql插件,届时使用会更加便利。

如果不使用pipelinedb的cv ttl功能,直接使用postgresql的话,可以使用PostgreSQL 10的worker process,设置删除任务,自动调度,删除记录,效果也是一样的。

pipelinedb cv ttl例子

创建一个流(定义数据的格式)

CREATE STREAM s1 (id int, info text, crt_time timestamp default now());  

创建cv ttl,例如根据crt_time字段,保留1分钟。

CREATE CONTINUOUS VIEW cv1 WITH (ttl = '1 min', ttl_column = 'crt_time') AS  
  SELECT id,info,crt_time FROM s1;  

激活cv

activate cv1;  

测试

写入数据

pipeline=# insert into s1 values (1,'test',now());  
INSERT 0 1  

查看数据

pipeline=# select * from cv1;  
 id | info |          crt_time            
----+------+----------------------------  
  1 | test | 2017-06-12 17:11:45.774904  
(1 row)  

1分钟后查看数据,自动被删除。

修改ttl,保留10秒

pipeline=# select set_ttl('cv1', '10 second', 'crt_time');  
 set_ttl   
---------  
 (10,3)  
(1 row)  

重新测试,数据写入10秒后,自动删除。

参考

http://docs.pipelinedb.com/continuous-views.html#time-to-live-ttl-expiration

《PostgreSQL 10.0 preview 功能增强 - 后台运行(pg_background)》

Flag Counter

digoal’s 大量PostgreSQL文章入口