Top K in 5min, 1hr, 1 day. 这种题目可以用count-min sketch吗?
我觉得不行,因为如果是5点5分 --> 5点6分,新的一分钟进来,没办法把最旧的一分钟退掉,加入新的一分钟, 但是youtube上說是可以的https://www.youtube.com/watch?v=kx-XDoPjoHw&t=921s
但是为什么trending可以呢?
Top K in 5min, 1hr, 1 day. 这种题目可以用count-min sketch吗?
我觉得不行,因为如果是5点5分 --> 5点6分,新的一分钟进来,没办法把最旧的一分钟退掉,加入新的一分钟, 但是youtube上說是可以的https://www.youtube.com/watch?v=kx-XDoPjoHw&t=921s
但是为什么trending可以呢?
不可以用,就是你说的这个原因。
这个视频的里的需求跟我们讲的不一样,视频里讲的问题是 topK in a data stream 而非 topK in a sliding window.
你说 Trending 可以用,你能具体提一下做法吗?
count min sketch 可以做减法么? 就是像课程里讲的, 一个stream做加法, 然后delay 的stream做减法? 这样是不是就达到了 sliding window的 TopK 要求的结果?
count min sketch 的算法使得它没法做减法。