一、在分布式數據庫存儲中,數據分區和數據放置的區別
數據分區和數據放置是邏輯和物理的關系,邏輯是頂層設計,物理是具體實現,邏輯設計決定物理實現,物理約束反過來影響邏輯設計。數據分區就是設計球和盒子對應關系的過程,數據放置就是球在盒子里面怎么擺放。
舉個例子,
給你10個乒乓球,要求放入3個盒子里。
如何決定哪個球放入哪個盒子?比如
按照編號大小:0-2放入盒子A,3-5放入盒子B,6-9放入盒子C按照編號特征:對3取余==0放入盒子A,取余==1放入盒子B,取余==2放入盒子C…上面的策略就是選擇數據分區的過程,既然有這么多分區方法可以選,選哪個較好?有一個比較重要的考慮因素是,3個盒子到底是什么特征?比如是否一樣大小。比如我告訴你盒子A和B只能放1個,盒子C可以放100個,那么上面兩種策略都不行。如果我告訴你,盒子ABC都能放100個,那么上面兩種策略都可以。具體到一個盒子里面,怎么放也有講究,比如隨便扔,或者用格子一個個放。
對比上面說的,數據分區就是設計球和盒子對應關系的過程,數據放置就是球在盒子里面怎么擺放。分配策略決定了如何利用每個盒子,但是盒子的特性會影響分配的策略,數據分區和數據放置也是如此,是互相融合不可分割的,所以有時候放在一起說也不奇怪。
延伸閱讀:
二、字符集(Character set)是什么
是多個字符(英文字符,漢字字符,或者其他國家語言字符)的集合,字符集種類較多,每個字符集包含的字符個數不同。
特點:
①字符編碼方式是用一個或多個字節表示字符集中的一個字符
②每種字符集都有自己特有的編碼方式,因此同一個字符,在不同字符集的編碼方式下,會產生不同的二進制
常見字符集:
ASCII字符集:基于羅馬字母表的一套字符集,它采用1個字節的低7位表示字符,高位始終為0。
LATIN1字符集:相對于ASCII字符集做了擴展,仍然使用一個字節表示字符,但啟用了高位,擴展了字符集的表示范圍。
GBK字符集:支持中文,字符有一字節編碼和兩字節編碼方式。
UTF8字符集:Unicode字符集的一種,是計算機科學領域里的一項業界標準,支持了所有國家的文字字符,utf8采用1-4個字節表示字符。