一、OceanBase相比其他開源的noSQL數(shù)據(jù)庫的優(yōu)點(diǎn)
1. OB的redolog是使用分布式一致性算法paxos實(shí)現(xiàn)的。所以在CAP理論中,雖然OB使用的是強(qiáng)一致模型,但是OB能在一定網(wǎng)絡(luò)分區(qū)的情況下做到高可用(通俗點(diǎn)講就是多余半數(shù)機(jī)器還活著的時(shí)候就能干活)。官方的MySQL目前做不到這一點(diǎn)
2. OB的存儲結(jié)構(gòu)使用的是兩級的LSM-tree。其中內(nèi)存中的C0 Btree葉節(jié)點(diǎn)不需要和磁盤上的btree一樣大小,所以能做得比較小,對cpu的cache比較友好,并且不會(huì)有寫入放大的問題。使得OB的寫性能有極大的提升。同時(shí)磁盤上的C1 tree不是一個(gè)傳統(tǒng)意義上的btree(btree未經(jīng)壓縮可能浪費(fèi)一半空間)。空間利用率大大提高。簡單來說就是速度快,省成本。這里說的比較粗略,想詳細(xì)理解自己去看LSM-tree的論文。
3. 數(shù)據(jù)庫自動(dòng)分片功能(支持hash/range,一級二級等等分片方式),提供獨(dú)立的proxy路由寫入查詢等操作到對應(yīng)的分片。這意味著數(shù)據(jù)量再大也不需要手動(dòng)分庫分表了。并且分片能在線的在各個(gè)server之間遷移,解決熱點(diǎn)問題(資源分配不均的問題,做到彈性加機(jī)器和減機(jī)器)。每個(gè)分片(確切的說是被選為主的分片)都支持讀寫,做到多點(diǎn)寫入(高吞吐量,性能可線性擴(kuò)展)。
4. 數(shù)據(jù)庫內(nèi)部實(shí)現(xiàn)的無阻塞的兩階段提交(跨機(jī)事務(wù))。參見論文Consensus on Transaction Commit
5. 數(shù)據(jù)庫原生的多租戶支持。能直接隔離租戶之間的cpu,mem,io等資源。
6. 基于代價(jià)的SQL查詢優(yōu)化和改寫功能,對于復(fù)雜的分析型SQL做得比MySQL好(目前比Oracle差,正在努力追趕中)。支持各種類型的join算法(nestloop, merge, hash),優(yōu)化器會(huì)自動(dòng)選擇優(yōu)異的join類型。支持類似Oracle的SPM功能,用戶能很輕松自如的管理查詢計(jì)劃。
7. 自動(dòng)化的集群管理,包括機(jī)器上下線,自動(dòng)下故障盤等等。總之OB的設(shè)計(jì)理念就是只要是數(shù)據(jù)庫需要解決的問題就不讓用戶操心。
延伸閱讀:
二、數(shù)據(jù)庫的查詢功能實(shí)現(xiàn)原理
數(shù)據(jù)庫查詢是數(shù)據(jù)庫的最主要功能之一。我們都希望查詢數(shù)據(jù)的速度能盡可能的快,因此數(shù)據(jù)庫系統(tǒng)的設(shè)計(jì)者會(huì)從查詢算法的角度進(jìn)行優(yōu)化。最基本的查詢算法當(dāng)然是順序查找(linear search),這種復(fù)雜度為O(n)的算法在數(shù)據(jù)量很大時(shí)顯然是糟糕的,好在計(jì)算機(jī)科學(xué)的發(fā)展提供了很多更優(yōu)異的查找算法,例如二分查找(binary search)、二叉樹查找(binary tree search)等。如果稍微分析一下會(huì)發(fā)現(xiàn),每種查找算法都只能應(yīng)用于特定的數(shù)據(jù)結(jié)構(gòu)之上,例如二分查找要求被檢索數(shù)據(jù)有序,而二叉樹查找只能應(yīng)用于二叉查找樹上,但是數(shù)據(jù)本身的組織結(jié)構(gòu)不可能完全滿足各種數(shù)據(jù)結(jié)構(gòu)(例如,理論上不可能同時(shí)將兩列都按順序進(jìn)行組織),所以,在數(shù)據(jù)之外,數(shù)據(jù)庫系統(tǒng)還維護(hù)著滿足特定查找算法的數(shù)據(jù)結(jié)構(gòu),這些數(shù)據(jù)結(jié)構(gòu)以某種方式引用(指向)數(shù)據(jù),這樣就可以在這些數(shù)據(jù)結(jié)構(gòu)上實(shí)現(xiàn)高級查找算法。這種數(shù)據(jù)結(jié)構(gòu),就是索引。