课上推荐用间断合并和渐进更新,可是感觉由于是variable
byte encoding,感觉每个keyword的posting list要update的话就得全部重新encode,没法做渐进的更新
还有课件上写:间断合并-新的索引和旧的索引 batch合并放在新的硬盘空间。
但是比如一个网页的内容有了更新,我们不能简单的合并新的和旧的索引,而是要吧旧的索引中关于这个文章的posting list去掉替换成新的。
间断合并是推荐做法。间断合并的做法是把原来的posting list和新的更新做一个合并,这里说的合并并不是 append 在后面,而是重新构建新的 posting list。