《Mysql入門mysql索引類型創建以及性能優化》要點:
本文介紹了Mysql入門mysql索引類型創建以及性能優化,希望對您有用。如果有疑問,可以聯系我們。
導讀:對于沒有索引的表,單表查詢可能幾十萬數據就是瓶頸,而通常大型網站單日就可能會產生幾十萬甚至幾百萬的數據,沒有索引查詢會變的非常緩慢...
對于沒有索引的表,單表查詢可能幾十萬數據就是瓶頸,而通常大型網站單日就可能會產生幾十萬甚至幾百萬的數據,沒有索引查詢會變的非常緩慢.還是以WordPress來說,其多個數據表都會對經常被查詢的字段添加索引,比如wp_comments表中針對5個字段設計了BTREE索引.
一個簡單的對比測試
以我去年測試的數據作為一個簡單示例,20多條數據源隨機生成200萬條數據,平均每條數據源都重復大概10萬次,表結構比較簡單,僅包含一個自增ID,一個char類型,一個text類型和一個int類型,單表2G大小,使用MyIASM引擎.開始測試未添加任何索引.
執行下面的SQL語句:
?mysql> SELECT id,FROM_UNIXTIME(time) FROM article WHERE a.title='測試標題'
查詢需要的時間非常恐怖的,如果加上聯合查詢和其他一些約束條件,數據庫會瘋狂的消耗內存,并且會影響前端程序的執行.這時給title字段添加一個BTREE索引:
?mysql> ALTER TABLE article ADD INDEX index_article_title ON title(200);
再次執行上述查詢語句,其對比非常明顯:
MySQL索引的概念
索引是一種特殊的文件(InnoDB數據表上的索引是表空間的一個組成部分),它們包含著對數據表里所有記錄的引用指針.更通俗的說,數據庫索引好比是一本書前面的目錄,能加快數據庫的查詢速度.上述SQL語句,在沒有索引的情況下,數據庫會遍歷全部200條數據后選擇符合條件的;而有了相應的索引之后,數據庫會直接在索引中查找符合條件的選項.如果我們把SQL語句換成“SELECT * FROM article WHERE id=2000000”,那么你是希望數據庫按照順序讀取完200萬行數據以后給你結果還是直接在索引中定位呢?上面的兩個圖片鮮明的用時對比已經給出了答案(注:一般數據庫默認都會為主鍵生成索引).
索引分為聚簇索引和非聚簇索引兩種,聚簇索引是按照數據存放的物理位置為順序的,而非聚簇索引就不一樣了;聚簇索引能提高多行檢索的速度,而非聚簇索引對于單行的檢索很快.
MySQL索引的類型
1. 普通索引
這是最基本的索引,它沒有任何限制,比如上文中為title字段創建的索引就是一個普通索引,MyIASM中默認的BTREE類型的索引,也是我們大多數情況下用到的索引.
- –直接創建索引?
- CREATE?INDEX?index_name?ON?table(column(length))?
- –修改表結構的方式添加索引?
- ALTER?TABLE?table_name?ADD?INDEX?index_name?ON?(column(length))?
- –創建表的時候同時創建索引?
- CREATE?TABLE?`table`?(?
- `id`?int(11)?NOT?NULL?AUTO_INCREMENT?,?
- `title`?char(255)?CHARACTER?SET?utf8?COLLATE?utf8_general_ci?NOT?NULL?,?
- `content`?text?CHARACTER?SET?utf8?COLLATE?utf8_general_ci?NULL?,?
- `time`?int(10)?NULL?DEFAULT?NULL?,?
- PRIMARY?KEY?(`id`),?
- INDEX?index_name?(title(length))?
- )?
- –刪除索引?
- DROP?INDEX?index_name?ON?table?
2. 唯一索引
與普通索引類似,不同的就是:索引列的值必須唯一,但允許有空值(注意和主鍵不同).如果是組合索引,則列值的組合必須唯一,創建方法和普通索引類似.
- –創建唯一索引?
- CREATE?UNIQUE?INDEX?indexName?ON?table(column(length))?
- –修改表結構?
- ALTER?TABLE?table_name?ADD?UNIQUE?indexName?ON?(column(length))?
- –創建表的時候直接指定?
- CREATE?TABLE?`table`?(?
- `id`?int(11)?NOT?NULL?AUTO_INCREMENT?,?
- `title`?char(255)?CHARACTER?SET?utf8?COLLATE?utf8_general_ci?NOT?NULL?,?
- `content`?text?CHARACTER?SET?utf8?COLLATE?utf8_general_ci?NULL?,?
- `time`?int(10)?NULL?DEFAULT?NULL?,?
- PRIMARY?KEY?(`id`),?
- UNIQUE?indexName?(title(length))?
3. 全文索引(FULLTEXT)
MySQL從3.23.23版開始支持全文索引和全文檢索,FULLTEXT索引僅可用于 MyISAM 表;他們可以從CHAR、VARCHAR或TEXT列中作為CREATE TABLE語句的一部分被創建,或是隨后使用ALTER TABLE 或CREATE INDEX被添加.////對于較大的數據集,將你的資料輸入一個沒有FULLTEXT索引的表中,然后創建索引,其速度比把資料輸入現有FULLTEXT索引的速度更為快.不過切記對于大容量的數據表,生成全文索引是一個非常消耗時間非常消耗硬盤空間的做法.
- –創建表的適合添加全文索引?
- CREATE?TABLE?`table`?(?
- `id`?int(11)?NOT?NULL?AUTO_INCREMENT?,?
- `title`?char(255)?CHARACTER?SET?utf8?COLLATE?utf8_general_ci?NOT?NULL?,?
- `content`?text?CHARACTER?SET?utf8?COLLATE?utf8_general_ci?NULL?,?
- `time`?int(10)?NULL?DEFAULT?NULL?,?
- PRIMARY?KEY?(`id`),?
- FULLTEXT?(content)?
- );?
- –修改表結構添加全文索引?
- ALTER?TABLE?article?ADD?FULLTEXT?index_content(content)?
- –直接創建索引?
- CREATE?FULLTEXT?INDEX?index_content?ON?article(content)?
4. 單列索引、多列索引
多個單列索引與單個多列索引的查詢效果不同,因為執行查詢時,MySQL只能使用一個索引,會從多個索引中選擇一個限制最為嚴格的索引.
5. 組合索引(最左前綴)
平時用的SQL查詢語句一般都有比較多的限制條件,所以為了進一步榨取MySQL的效率,就要考慮建立組合索引.例如上表中針對title和time建立一個組合索引:ALTER TABLE article ADD INDEX index_titme_time (title(50),time(10)).建立這樣的組合索引,其實是相當于分別建立了下面兩組組合索引:
–title,time
–title
為什么沒有time這樣的組合索引呢?這是因為MySQL組合索引“最左前綴”的結果.簡單的理解就是只從最左面的開始組合.并不是只要包含這兩列的查詢都會用到該組合索引,如下面的幾個SQL所示:
- –使用到上面的索引?
- SELECT?*?FROM?article?WHREE?title='測試'?AND?time=1234567890;?
- SELECT?*?FROM?article?WHREE?utitle='測試';?
- –不使用上面的索引?
- SELECT?*?FROM?article?WHREE?time=1234567890;?
MySQL索引的優化MYSQL教程
上面都在說使用索引的好處,但過多的使用索引將會造成濫用.因此索引也會有它的缺點:雖然索引大大提高了查詢速度,同時卻會降低更新表的速度,如對表進行INSERT、UPDATE和DELETE.因為更新表時,MySQL不僅要保存數據,還要保存一下索引文件.建立索引會占用磁盤空間的索引文件.一般情況這個問題不太嚴重,但如果你在一個大表上創建了多種組合索引,索引文件的會膨脹很快.索引只是提高效率的一個因素,如果你的MySQL有大數據量的表,就需要花時間研究建立最優秀的索引,或優化查詢語句.下面是一些總結以及收藏的MySQL索引的注意事項和優化方法.
1. 何時使用聚集索引或非聚集索引?
動作描述 |
使用聚集索引 |
使用非聚集索引 |
列經常被分組排序 |
使用 |
使用 |
返回某范圍內的數據 |
使用 |
不使用 |
一個或極少不同值 |
不使用 |
不使用 |
小數目的不同值 |
使用 |
不使用 |
大數目的不同值 |
不使用 |
使用 |
頻繁更新的列 |
不使用 |
使用 |
外鍵列 |
使用 |
使用 |
主鍵列 |
使用 |
使用 |
頻繁修改索引列 |
不使用 |
使用 |
事實上,我們可以通過前面聚集索引和非聚集索引的定義的例子來理解上表.如:返回某范圍內的數據一項.比如您的某個表有一個時間列,恰好您把聚合索引建立在了該列,這時您查詢2004年1月1日至2004年10月1日之間的全部數據時,這個速度就將是很快的,因為您的這本字典正文是按日期進行排序的,聚類索引只需要找到要檢索的所有數據中的開頭和結尾數據即可;而不像非聚集索引,必須先查到目錄中查到每一項數據對應的頁碼,然后再根據頁碼查到具體內容.其實這個具體用法我還不是很理解,只能等待后期的項目開發中慢慢學學了.
2. 索引不會包含有NULL值的列
只要列中包含有NULL值都將不會被包含在索引中,復合索引中只要有一列含有NULL值,那么這一列對于此復合索引就是無效的.所以我們在數據庫設計時不要讓字段的默認值為NULL.
3. 使用短索引
對串列進行索引,如果可能應該指定一個前綴長度.例如,如果有一個CHAR(255)的列,如果在前10個或20個字符內,多數值是惟一的,那么就不要對整個列進行索引.短索引不僅可以提高查詢速度而且可以節省磁盤空間和I/O操作.
4. 索引列排序
MySQL查詢只使用一個索引,因此如果where子句中已經使用了索引的話,那么order by中的列是不會使用索引的.因此數據庫默認排序可以符合要求的情況下不要使用排序操作;盡量不要包含多個列的排序,如果需要最好給這些列創建復合索引.
5. like語句操作
一般情況下不鼓勵使用like操作,如果非使用不可,如何使用也是一個問題.like “%aaa%” 不會使用索引而like “aaa%”可以使用索引.
6. 不要在列上進行運算
例如:select * from users where YEAR(adddate)<2007,將在每個行上進行運算,這將導致索引失效而進行全表掃描,因此我們可以改成:select * from users where adddate<’2007-01-01′.關于這一點可以圍觀:一個單引號引發的MYSQL性能損失.
最后總結一下,MySQL只對一下操作符才使用索引:<,<=,=,>,>=,between,in,以及某些時候的like(不以通配符%或_開頭的情形).而理論上每張表里面最多可創建16個索引,不過除非是數據量真的很多,否則過多的使用索引也不是那么好玩的,比如我剛才針對text類型的字段創建索引的時候,系統差點就卡死了.
轉載請注明本頁網址:
http://www.fzlkiss.com/jiaocheng/5789.html