Spark
1
老师您好,有以下几个问题不太明白:
- 使用SQL DB,那么如何做到分布式存储?Distributed SQL?
- Document Operation Table 中第一个column是operation ID,一般我们都是用第一个column作为primary key,为什么这里要指定primary key 为document id+timestamp?
logic
2
- 用 SQL Proxy, 比如 proxysql
- 第一列不一定是 primary key,几乎所有数据库创建表的时候都可以自定义 Primary Key,这里用的是 Composite key,由两列组成的 Unique Key.
扩展阅读