[Autocomplete] Score DB schema 和builder问题

老师课上说Popularity Score DB存在hive里面,这里不太清楚schema是怎么样的,请问这个hive table的key是word,value就是score吗?Autocomplete builder如何找出每个prefix的topK score呢,是要scan这个hive table 吗?

Schema 就是一对 key-value 如你所说。
Autocomplete Builder 的一种方案是用一个 MapReduce Job. Mapper 把 Hive Table 里的每个词变成一组 prefix,Reducer 把相同的 Prefix 汇总并且取出 TopK。需要遍历 Hive Table 的每一条