[搜索系统] 存储方案

有两个问题还是不太明白,希望老师能解答一下,谢谢:pray:

  1. 硬盘的存储方案为什么选择BigTable 而不是其他的数据库?
  2. 还有不太明白这个 内存存储document partitioned 数据是如何存的?是按照 document number 对应着(doc_id, pos1, pos2) 存的么?
  1. Bigtable 非常适合我们要求的先写入内存再整体并入硬盘的写入模式(间断更新)。其他数据库不提供这个特性。其他选项,比如 SQL DB, 其他 wide-column db 也可以考虑,但都不如 Bigtable 那么合适。
  2. 不是。document-partition 的意思是按照 document partition 而不是做 key。 每个 partition 存储的数据的每一行是关键词对应一个 posting list,这个 posting list 只包含特定的一部分 document。