MySQL的數據類型和建庫策略
無論是在(zài)小得(dé)可憐的(de)免費數據庫空間或是大(dà)型(xíng)電子商務網站,合理的設計表結構、充分利用空間是十分必要(yào)的。這就要求我們對數據庫係統的(de)常用數據(jù)類型有充分的認識。下麵我就將我(wǒ)的(de)一點心(xīn)得寫出來跟(gēn)大家分享(xiǎng)。
一、數字(zì)類(lèi)型。數字類型按照我的(de)分類方法分為(wéi)三類:整數類、小數類和數字類。
我所謂(wèi)的“數字類”,就(jiù)是指DECIMAL和NUMERIC,它們是同一種類型。它嚴(yán)格的說不是(shì)一種數字類型,因為他們實際上是將數字以字符串形式保存的;他的值的每一位(包括小數點)占一個字節的存儲空間,因此這種類型耗費空間比(bǐ)較大(dà)。但是它的一個突出(chū)的優點是小數的位數固定,在運算中不會(huì)“失真”,所以比較適合用於“價格”、“金額”這樣(yàng)對精度要求不高但準(zhǔn)確(què)度要求非常高的(de)字(zì)段。
小數類,即浮點數類型,根據精度的不同,有FLOAT(單精度)和DOUBLE(雙精度)兩種。它們(men)的優勢是精確度(dù),FLOAT可以表(biǎo)示絕對值非(fēi)常小、小到約 1.17E-38 (0.000...0117, 小數點(diǎn)後麵有(yǒu)37個零)的小數,而DOUBLE更是可(kě)以表示絕對值小到約 2.22E-308 (0.000...0222, 小數點後麵有307個(gè)零)的(de)小(xiǎo)數。FLOAT類型和DOUBLE類型占用存儲空間分(fèn)別是4字節和8字節。如果需要用到小數的字段(duàn),精度要求不高的,當然用(yòng)FLOAT了!可是說句實(shí)在話,我們“民用”的數據(jù),哪有要求精度那(nà)麽高的呢?這(zhè)兩種類型至今我沒有用過——我還沒有遇到適合於(yú)使用它們的事例。
用的最(zuì)多(duō)的,最值得精打細算的,是整數(shù)類型。從隻占一個(gè)字節存儲空間的TINYINT到占8個字節的BIGINT,挑選一個“夠(gòu)用”並且占用存儲(chǔ)空間最小的類型是設計數據庫時應該考慮的。TINYINT、SMALLINT、MEDIUMINT、INT和BIGINT占用存儲空間分別為1字節、2字節、3字節、4字節和8字節,就無符號的整數(shù)而言,這些類型能表示的最大整數分別為255、65535、16777215、4294967295和(hé)18446744073709551615。如果用來保存(cún)用戶的(de)年齡(舉例(lì)來說,數據庫中保存年齡是不可取的),用TINYINT就(jiù)夠了(le);九城的《縱橫》裏,各項技(jì)能值,用SMALLINT也夠了;如果要用作(zuò)一個肯定不會超過16000000行的表的AUTO_INCREMENT的IDENTIFY字段,當然用 MEDIUMINT 不用 INT ,試想,每行節約一個字節,16000000行可以節約(yuē)10兆多呢(ne)!
二、日期(qī)時間類型(xíng)。
日期和時間類型比較簡單,無非是 DATE、TIME、DATETIME、TIMESTAMP和YEAR等幾個類型。隻對日期敏感,而對時間沒有要求的字段,就用(yòng)DATE而不用DATETIME是不用說(shuō)的了;單獨使用時間的情況也(yě)時有發(fā)生——使(shǐ)用TIME;但最多用到的還是用DATETIME。在日期時間類型上沒有什麽文章可做,這裏就不再詳述。
三、字符(串)類型。
不要以(yǐ)為字符類型就是 CHAR !CHAR和VARCHAR的(de)區別在於(yú)CHAR是固定長度,隻要你定義一個字段是CHAR(10),那麽不論你存儲的數據是否達到了10個字節,它都要(yào)占去10個(gè)字節的空間(jiān);而VARVHAR則是可變長度的,如果一個字段可能的值是不固定長度的,我們隻知道它不可能超過10個字符(fú),把它定義為 VARCHAR(10)是最合算(suàn)的,VARCHAR 類型的(de)實際長度是它(tā)的值的(實際長度+1)。為什麽“+1”呢?這一個字節用於保存實際使用了多大的長度呀!從這個“+1”中也應該看到,如果(guǒ)一個字段,它的可(kě)能值最長是10個字符,而多數情況下也就是(shì)用到了10個字符時,用VARCHAR就不合算了:因(yīn)為(wéi)在多(duō)數情況下,實際占用空間是11個字節,比用CHAR(10)還多(duō)占用一個字節!
舉個例子,就是一個存儲股票名稱(chēng)和代碼的表,股票(piào)名(míng)稱(chēng)絕大部分是四(sì)個字的,即8個字節;股票代碼,上海的(de)是六位數字,深圳的是四位數字。這些都(dōu)是固定長度的,股(gǔ)票名稱當然要用 CHAR(8) ;股票代(dài)碼雖然是(shì)不固定(dìng)長度,但如果使用VARVHAR(6),一個深(shēn)圳的股票代碼實際占用空間是5個字(zì)節,而一個上海的股票代碼要占用(yòng)7個字節!考慮到上海的股票數目比深圳的多,那麽用VARCHAR(6)就不如(rú)CHAR(6)合算(suàn)了。
雖然一個CHAR或VARVHAR的最大長(zhǎng)度可以到255,我認為大(dà)於20的CHAR是幾乎(hū)用不到的——很少有大(dà)於20個字節長度的固定(dìng)長度的東東吧?不是固定長度的就用VARCHAR!大於100的VARCHAR也是幾(jǐ)乎用不到的——比這更(gèng)大的用TEXT就好了。TINYTEXT,最(zuì)大長度為255,占用空間也是(實際長度+1);TEXT,最大(dà)長度65535,占用空間是(實際長度+2);MEDIUMTEXT,最大長度16777215,占用空間是(shì)(實際長度+3);LONGTEXT,最大長度4294967295,占用空間是(shì)(實際長度+4)。為什(shí)麽(me)“+1”?“+2”?“+3”?“+4”?你要(yào)是還不知道就該打PP了。這些可(kě)以用在論壇啊、新聞啊,什麽的,用來保存文章的(de)正(zhèng)文。根據實際情況(kuàng)的(de)不同,選(xuǎn)擇從小到大的不同類型。
四、枚(méi)舉和集合類(lèi)型。
枚舉(jǔ)(ENUM)類(lèi)型(xíng),最(zuì)多可以定義65535種不同的字符串從中做出(chū)選擇,隻能並且必須(xū)選擇其中一種,占用存儲空間是一個或兩個字節,由枚舉(jǔ)值的數目決定;集合(SET)類型,最多可以有64個成員,可以選擇其(qí)中的零個到不限定的多個,占用存儲空間是一個到八個字節,由集合可能的成員數目決定。
舉個(gè)例子來說,在SQLServer中,你可(kě)以節約到(dào)用一個Bit類型來表示性別(男/女),但(dàn)MySQL沒有Bit,用TINTINT?不,可以用ENUM('帥哥','美眉')!隻有兩種選(xuǎn)擇(zé),所以隻(zhī)需一個字節——跟TINYINT一樣大,但卻可以直接用字符串'帥哥(gē)'和'美眉'來存取。真是太方便啦!
好了,MySQL的數據類型介紹得差不多,我的建庫策略也隨著介紹數據類型(xíng)介紹給大家(jiā)一些。但這隻是其中一部分,篇幅(fú)有限,不能再細說;其他的,就靠各人在對數據類型理解的基礎上(shàng),多多實踐、多多討(tǎo)論。
關鍵詞:MySQL,數據類型,建庫策(cè)略
閱讀本文後您有什麽感想? 已有 人給出評(píng)價!
- 0
- 0
- 0
- 0
- 0
- 0