- 请问上课讲得内存索引是按doc shard的 那为什么还需要这个doc_id_1, doc_id2,
这里是不是doc_id都是同一个值吗? 或者为什么需要重复这么多次一样的doc_id_x?
- 这里的单一关键词搜索
a. cache query
b. 内存索引:第二步 DocID 排序的Posting List
c. 内存索引:…
请问这里的内存索引为什么是按docID排序呢?我理解的是这里是一个Request去内存里找,然后汇总到一起最后按docID排序,不知道是不是这个意思?如果是, 那如果汇总的数据太大, 一台放不下怎么办?
-
index maintainers是要把in-memory index storage里面的部分不常访问的内容 转移到on-disk index storage吗?
-
请问是on-disk index storage 会有in-memory index storage 里面的全部信息吗(当然存储格式不一样)?还是说 除了最新的index(disk 没有)旧数据disk都有?
我理解是in-memory有全部最新的index, 然后index-maintainer会定期的向disk去发送new changes(从in-memory storage得到).
- 想确定一下 map-reduce只是跟新in-memory index storage, 不会更新on-disk index storage, on-disk index storage 是有index-maintainer定期更新的
谢谢