傳統 RDBMS 設計是用來做 transactions 要保持 consistency,並不適合儲存 Big Data。犧牲一些 consistency 及 fancy SQL,換取分散式架構,那就是 Cassandra。
Cassandra 可靠嗎?Apple 用左 75,000 nodes 儲存了超過 10 PB 資料。Cassandra 難安裝嗎?解壓就 run 得。
不過要注要一下,Cassandra 的預設 config 好進取,如果部 server 有其他野 run 梗,好容易會 out of memory error,要調一調 con/jvm.options
中的 heap size,也可以把 assertions
關掉。GC 也有得選。
加 node 也很容易,設好連接的 seeds 便可。預設是為左 quick start,真正用時改一改 endpoint_snitch
做 PropertyFileSnitch
及設置 cassandra-topology.properties