假如我们的业务需求是query用户过去一个月的location/ app usage, etc,我们可以使用no-sql db例如Cassandra去存储time series data。比如user id可以是partition key,然后timestamp可以是clustering key to keep data sorted by ts. 问题是我们的数据会越来越多,但是业务需求只需要查找过去一个月的用户数据。
这时如果面试官问你需要存储一个月以上的数据吗?如果不需要的话,如何处理那些过期的数据呢?可以简单的比如定期每日执行脚本删除过期的数据吗?有没有更好的办法呢?