在卡桑德拉(Cassandra)存储最后一次时光的最佳方法[英] Best way to store last-touched time in Cassandra

本文是小编为大家收集整理的关于在卡桑德拉(Cassandra)存储最后一次时光的最佳方法的处理方法,想解了在卡桑德拉(Cassandra)存储最后一次时光的最佳方法的问题怎么解决?在卡桑德拉(Cassandra)存储最后一次时光的最佳方法问题的解决办法?那么可以参考本文帮助大家快速定位并解决问题。

问题描述

我在Postgres的用户表中存储了最后一个点击的时间,但是有很多频繁的更新和足够的争论,我可以看到3个相同更新的示例.

.

Cassandra似乎更适合这一点 - 但是我应该专用桌子来实现这个目的吗?而且我不需要旧的时间戳,只是最新的.我应该使用卡桑德拉以外的其他东西吗? 如果我应该使用Cassandra,则在表属性上有任何提示?

我想到的桌子:

CREATE TABLE ksp1.user_last_job_activities (
    user_id bigint,
    touched_at timeuuid,
    PRIMARY KEY (user_id, touched_at)
) WITH CLUSTERING ORDER BY (touched_at DESC)
    AND bloom_filter_fp_chance = 0.01
    AND caching = '{"keys":"ALL", "rows_per_partition":"NONE"}'
    AND comment = ''
    AND compaction = {'min_threshold': '4', 'class': 'org.apache.cassandra.db.compaction.SizeTieredCompactionStrategy', 'max_threshold': '32'}
    AND compression = {'sstable_compression': 'org.apache.cassandra.io.compress.LZ4Compressor'}
    AND dclocal_read_repair_chance = 0.1
    AND default_time_to_live = 0
    AND gc_grace_seconds = 864000
    AND max_index_interval = 2048
    AND memtable_flush_period_in_ms = 0
    AND min_index_interval = 128
    AND read_repair_chance = 0.0
    AND speculative_retry = '99.0PERCENTILE';

更新

谢谢!我在写作时做了一些实验,而且由于我不得不写一个值,所以我只是写了时间.

喜欢:

CREATE TABLE simple_user_last_activity (
    user_id bigint,
    touched_at timestamp,
    PRIMARY KEY (user_id)
);

然后:

INSERT INTO simple_user_last_activity (user_id, touched_at) VALUES (6, dateof(now()));
SELECT touched_at from simple_user_last_activity WHERE user_id = 6;

由于thined_at不再在主键中,只存储每个用户的记录.

更新2

我要选择的另一种选择.我也可以存储Job_ID,这为分析提供了更多数据:

CREATE TABLE final_user_last_job_activities (
    user_id bigint,
    touched_at timestamp,
    job_id bigint,
    PRIMARY KEY (user_id, touched_at)
) 
WITH CLUSTERING ORDER BY (touched_at DESC)
AND default_time_to_live = 604800;

添加1周的TTL负责到期记录 - 如果没有,我会返回当前时间.

INSERT INTO final_user_last_job_activities (user_id, touched_at, job_id) VALUES (5, dateof(now()), 5);
INSERT INTO final_user_last_job_activities (user_id, touched_at, job_id) VALUES (5, dateof(now()), 6);
INSERT INTO final_user_last_job_activities (user_id, touched_at, job_id) VALUES (5, dateof(now()), 7);
INSERT INTO final_user_last_job_activities (user_id, touched_at, job_id) VALUES (5, dateof(now()), 6);

SELECT * FROM final_user_last_job_activities LIMIT 1;

给我:

 user_id | touched_at               | job_id
---------+--------------------------+--------
       5 | 2015-06-17 12:43:30+1200 |      6

简单的基准测试在较大表中存储或读取方面没有明显的性能差异.

推荐答案

因为c*是最后写的胜利,因此您可以简单地保留每一行的最新版本.

您可以按照MSD的建议,使用writetime拉动写的时间.但是要小心,因为这是特定于列的,您不能在主键列上使用写入时间.例如,在表中如下:

cqlsh> create TABLE test.test ( a int, b int, c int, d int, primary key (a))
   ... ;
cqlsh> insert INTO  test.test (a, b, c, d) VALUES ( 1,2,3,4)
   ... ;

cqlsh> select * from test.test
   ... ;

 a | b    | c | d
---+------+---+------
 1 |    2 | 3 |    4

(2 rows)

cqlsh> insert into test.test (a,c) values (1, 6);
cqlsh> select * from test.test ;

 a | b    | c | d
---+------+---+------
 1 |    2 | 6 |    4

(2 rows)
cqlsh> select writetime(a), writetime(b), writetime(c), writetime(d) from test.test
   ... ;
InvalidRequest: code=2200 [Invalid query] message="Cannot use selection function writeTime on PRIMARY KEY part a"

cqlsh> select  writetime(b), writetime(c), writetime(d) from test.test  ;

 writetime(b)     | writetime(c)     | writetime(d)
------------------+------------------+------------------
 1434424690700887 | 1434424690700887 | 1434424702420929

否则,您可以使用时间戳添加CQL列:

create TABLE test.test ( a int, b int, c int, d int, touched_at timeuuid, primary key (a)) ;

一些快速的基准测试可以帮助您确定哪些更具性能.

其他推荐答案

Cassandra每列具有对writetime的隐式支持.请参阅 this ,看起来这就是您正在寻找的东西为此.

本文地址:https://www.itbaoku.cn/post/1764036.html