《Mysql應用MySQL order by性能優化方法實例》要點:
本文介紹了Mysql應用MySQL order by性能優化方法實例,希望對您有用。如果有疑問,可以聯系我們。
MYSQL數據庫前言
MYSQL數據庫工作過程中,各種業務需求在拜訪數據庫的時候要求有order by排序.有時候不必要的或者不合理的排序操作很可能導致數據庫系統崩潰.如何處理好order by排序呢?本文從原理以及優化層面介紹 order by .
MYSQL數據庫一 MySQL中order by的原理
MYSQL數據庫? 1 利用索引的有序性獲取有序數據
MYSQL數據庫? 當查詢語句的 order BY 條件和查詢的執行計劃中所利用的 Index 的索引鍵(或前面幾個索引鍵)完全一致,且索引拜訪方式為 rang,ref 或者 index 的時候,MySQL 可以利用索引順序而直接取得已經排好序的數據.這種方式的 order BY 基本上可以說是最優的排序方式了,因為 MySQL 不需要進行實際的排序操作.需要注意的是使用索引排序也有很多限制.這個在后文中中解釋.
MYSQL數據庫? 2 利用內存/磁盤文件排序獲取結果
MYSQL數據庫? 由于沒有可以利用的有序索引取得有序的數據,MySQL必要通過相應的排序算法,將取得的數據在sort_buffer_size系統變量所設置大小的排序區進行排序,這個排序區是每個Thread 獨享的,所以說可能在同一時刻在 MySQL 中可能存在多個 sort buffer 內存區域.
? 在MySQL中filesort 的實現算法有兩種:
MYSQL數據庫? 1) 雙路排序:是首先根據相應的條件取出相應的排序字段和可以直接定位行數據的行指針信息,然后在sort buffer 中進行排序.
? 2) 單路排序:是一次性取出滿足條件行的所有字段,然后在sort buffer中進行排序.
MYSQL數據庫? 在 MySQL4.1 版本之前只有第一種排序算法,第二種算法是從MySQL4.1開始的改進算法,主要目的是為了減少第一次算法中需要兩次拜訪表數據的IO操作,將兩次變成了一次,但相應也會耗用更多的 sort buffer 空間.典型的以空間換時間的優化方式.當然,MySQL4.1開始的以后所有版本同時也支持第一種算法,MySQL主要通過比較系統參數 max_length_for_sort_data的大小和Query語句所取出的字段類型大小總和來判定需要使用哪一種排序算法.如果max_length_for_sort_data更大,則使用第二種優化后的算法,反之使用第一種算法.所以如果希望 order BY 操作的效率盡可能的高,需要注意max_length_for_sort_data參數的設置.
MYSQL數據庫二 優化order by
MYSQL數據庫當無法避免排序操作時,又該如何來優化呢?很顯然,優先選擇第一種using index 的排序方式,在第一種方式無法滿足的情況下,盡可能讓 MySQL 選擇使用第二種單路算法來進行排序.這樣可以減少大量的隨機IO操作,很大幅度地提高排序工作的效率.
MYSQL數據庫1 加大 max_length_for_sort_data 參數的設置
MYSQL數據庫? 在 MySQL 中,決定使用老式排序算法還是改進版排序算法是通過參數 max_length_for_ sort_data 來決定的.當所有返回字段的最大長度小于這個參數值時,MySQL 就會選擇改進后的排序算法,反之,則選擇老式的算法.所以,如果有充足的內存讓MySQL 存放須要返回的非排序字段,就可以加大這個參數的值來讓 MySQL 選擇使用改進版的排序算法.
MYSQL數據庫2 去掉不需要的返回字段
MYSQL數據庫? 當內存不是很充裕時,不能簡單地通過強行加大上面的參數來逼迫 MySQL 去使用改進版的排序算法,否則可能會造成 MySQL 不得不將數據分成很多段,然后進行排序,這樣可能會得不償失.此時就須要去掉不必要的返回字段,讓返回結果長度適應 max_length_for_sort_data 參數的限制.
MYSQL數據庫3 增大 sort_buffer_size 參數設置
MYSQL數據庫? 這個值如果過小的話,再加上你一次返回的條數過多,那么很可能就會分很多次進行排序,然后最后將每次的排序結果再串聯起來,這樣就會更慢,增大 sort_buffer_size 并不是為了讓 MySQL選擇改進版的排序算法,而是為了讓MySQL盡量減少在排序過程中對須要排序的數據進行分段,因為分段會造成 MySQL 不得不使用臨時表來進行交換排序.
MYSQL數據庫但是這個值不是越大越好:
MYSQL數據庫1 Sort_Buffer_Size 是一個connection級參數,在每個connection第一次必要使用這個buffer的時候,一次性分配設置的內存.
2 Sort_Buffer_Size 并不是越大越好,由于是connection級的參數,過大的設置+高并發可能會耗盡系統內存資源.
3 據說Sort_Buffer_Size 超過2M的時候,就會使用mmap() 而不是 malloc() 來進行內存分配,導致效率降低.
歡迎參與《Mysql應用MySQL order by性能優化方法實例》討論,分享您的想法,維易PHP學院為您提供專業教程。