Icey
1
有两个问题还是不太明白,希望老师能解答一下,谢谢
- 硬盘的存储方案为什么选择BigTable 而不是其他的数据库?
- 还有不太明白这个 内存存储document partitioned 数据是如何存的?是按照 document number 对应着(doc_id, pos1, pos2) 存的么?
logic
2
- Bigtable 非常适合我们要求的先写入内存再整体并入硬盘的写入模式(间断更新)。其他数据库不提供这个特性。其他选项,比如 SQL DB, 其他 wide-column db 也可以考虑,但都不如 Bigtable 那么合适。
- 不是。document-partition 的意思是按照 document partition 而不是做 key。 每个 partition 存储的数据的每一行是关键词对应一个 posting list,这个 posting list 只包含特定的一部分 document。