[Top K] Top K in 5min, 1hr, 1 day

Top K in 5min, 1hr, 1 day. 这种题目可以用count-min sketch吗?
我觉得不行,因为如果是5点5分 --> 5点6分,新的一分钟进来,没办法把最旧的一分钟退掉,加入新的一分钟, 但是youtube上說是可以的https://www.youtube.com/watch?v=kx-XDoPjoHw&t=921s

但是为什么trending可以呢?

不可以用,就是你说的这个原因。
这个视频的里的需求跟我们讲的不一样,视频里讲的问题是 topK in a data stream 而非 topK in a sliding window.
你说 Trending 可以用,你能具体提一下做法吗?

  1. 如果要處理 1.5 - 2.5這種精度就只能sliding window
  2. 如果精度要求不高:bucket、count-min sketch也可以
  3. mapreduce經度高嗎?ans: mapreduce 精度高,但延迟也高

count min sketch 可以做减法么? 就是像课程里讲的, 一个stream做加法, 然后delay 的stream做减法? 这样是不是就达到了 sliding window的 TopK 要求的结果?

count min sketch 的算法使得它没法做减法。