《京東活動系統(tǒng)億級流量應(yīng)對之術(shù)》要點(diǎn):
本文介紹了京東活動系統(tǒng)億級流量應(yīng)對之術(shù),希望對您有用。如果有疑問,可以聯(lián)系我們。
作者:干天星,2012年初加入京東,先后在京東審計(jì)、搭配購、jshop活動系統(tǒng)等項(xiàng)目從事系統(tǒng)研發(fā)和架構(gòu)工作.目前主要負(fù)責(zé)jshop活動系統(tǒng)架構(gòu)升級,以及jshop數(shù)據(jù)中心實(shí)現(xiàn)運(yùn)算架構(gòu)設(shè)計(jì).對構(gòu)建高并發(fā)web架構(gòu),以及高性能實(shí)時(shí)大數(shù)據(jù)運(yùn)算,有一定的見解.入職前有過5年電信傳統(tǒng)行業(yè)開發(fā)、架構(gòu)經(jīng)驗(yàn).
京東活動系統(tǒng)是一個(gè)可在線編輯、實(shí)時(shí)編輯更新和發(fā)布新活動,并對外提供頁面訪問服務(wù)的系統(tǒng),地址如http://sale.jd.com/***.html.其高時(shí)效性、靈活性等特征,極受青睞,已發(fā)展成京東幾個(gè)重要流量入口之一.近幾次大促,系統(tǒng)所承載的PV均為數(shù)億以上.隨著京東業(yè)務(wù)的高速發(fā)展,京東活動系統(tǒng)的壓力會越來越大.急需要一個(gè)更高效,穩(wěn)定的系統(tǒng)架構(gòu),來支持業(yè)務(wù)的高速發(fā)展.本文主要對活動頁面瀏覽方面的性能,進(jìn)行探討.
活動頁面瀏覽性能提升的難點(diǎn):
活動與活動之間差異很大,不像商品頁有固定的模式.每個(gè)頁面能抽取的公共部分有限,可復(fù)用性差;
活動頁面內(nèi)容多樣,業(yè)務(wù)繁多.依賴大量外部業(yè)務(wù)接口,數(shù)據(jù)很難做到閉環(huán).外部接口的性能,以及穩(wěn)定性,嚴(yán)重制約了活動頁的渲染速度、穩(wěn)定性;
經(jīng)過多年在該系統(tǒng)下的開發(fā)實(shí)踐,提出“頁面渲染與頁面瀏覽異步化”的思想,頁面渲染是把渲染好的整頁數(shù)據(jù)放到redis或者硬盤里了,頁面瀏覽是從redis或者硬盤里取靜態(tài)的頁面,并以此為指導(dǎo),對該系統(tǒng)進(jìn)行架構(gòu)升級改造.通過近幾個(gè)月的運(yùn)行,各方面性能都有顯著提升.在分享”新架構(gòu)”之前,先看看我們現(xiàn)有web系統(tǒng)的架構(gòu)現(xiàn)狀.
*瀏覽服務(wù)
以京東活動系統(tǒng)架構(gòu)的演變?yōu)槔?這里沒有畫出具體的業(yè)務(wù)邏輯,只是簡單的描述下架構(gòu).
我們會在消耗性能的地方加緩存,這里對部分查庫操作加redis緩存.
并且對頁面進(jìn)行整頁redis緩存:由于活動頁面內(nèi)容繁多,渲染一次頁面的成本是很高.這里可以考慮把渲染好的活動內(nèi)容整頁緩存起來,下次請求到來時(shí),如果緩存中有值,直接獲取緩存返回.
以上是系統(tǒng)應(yīng)用服務(wù)層面架構(gòu)演進(jìn)的,簡單示意.為了減少應(yīng)用服務(wù)器的壓力,可以在應(yīng)用服務(wù)器前面,加cdn和nginx的proxy_cache,減少回源率.
整體架構(gòu)(老)
除了“瀏覽服務(wù)”外,老架構(gòu)還做了其他兩個(gè)大的優(yōu)化:“接口服務(wù)”、“靜態(tài)服務(wù)”
接口服務(wù)分兩類,直接讀redis緩存和調(diào)用外部接口.這里可以對直接讀redis的接口采用nginx+lua(openresty)進(jìn)行優(yōu)化,不做詳細(xì)講解.本次分享主要對“瀏覽服務(wù)”架構(gòu).
在講新架構(gòu)之前先看看新老架構(gòu)下的新能對比.
*老架構(gòu)瀏覽服務(wù)性能
擊穿cdn緩存、nginx緩存,回源到應(yīng)用服務(wù)器的流量大約為20%-40%之間,這里的性能對比,只針對回源到應(yīng)用服務(wù)器的部分.
瀏覽方法TP99如下(物理機(jī))
TP99? 1000ms左右,且抖動幅度很大,內(nèi)存使用近70%,cpu 45%左右.1000ms內(nèi)沒有緩存,有阻塞甚至掛掉的風(fēng)險(xiǎn).
* 新架構(gòu)瀏覽服務(wù)性能
本次2016 618采用新架構(gòu)支持,瀏覽TP99如下(分app端活動和pc端活動)
移動活動瀏覽TP99穩(wěn)定在8ms, PC活動瀏覽TP99 穩(wěn)定在15ms左右.全天幾乎一條直線,沒有性能抖動.
新架構(gòu)支持,服務(wù)器(docker)cpu性能如下
cpu消耗一直平穩(wěn)在1%,幾乎沒有抖動.
對比結(jié)果:新架構(gòu)TP99從1000ms降低到15ms,cpu消耗從45%降低到1%,新架構(gòu)性能得到質(zhì)的提升.
why!!!下面我們就來揭開新架構(gòu)的面紗.
*頁面渲染與頁面瀏覽異步化
再來看之前的瀏覽服務(wù)架構(gòu),20%-40%的頁面請求會重新渲染頁面,渲染需要重新計(jì)算、查詢、創(chuàng)建對象等導(dǎo)致cpu、內(nèi)存消耗增加,TP99性能下降.
如果能保證每次請求都能獲取到redis整頁緩存,這些性能問題就都不存在了.即:頁面渲染與頁面瀏覽異步.
*直接改造后的問題以及解決方案
理想情況下,如果頁面數(shù)據(jù)變動可以通過手動觸發(fā)渲染(頁面發(fā)布新內(nèi)容)、外部數(shù)據(jù)變化通過監(jiān)聽mq自動觸發(fā)渲染.
但是有些外部接口不支持mq、或者無法使用mq,比如活動頁面置入的某個(gè)商品,這個(gè)商品名稱變化.
為了解決這個(gè)問題,view工程每隔指定時(shí)間,向engine發(fā)起重新渲染請求-最新內(nèi)容放入redis.下一次請求到來時(shí)即可獲取到新內(nèi)容.由于活動很多,也不能確定哪些活動在被訪問,所以不建議使用timer.通過加一個(gè)緩存key來實(shí)現(xiàn),處理邏輯如下.
好處就是,只對有訪問的活動定時(shí)重新發(fā)起渲染.
*整理架構(gòu)(不包含業(yè)務(wù))
view工程職責(zé):
直接從緩存或者硬盤中獲取靜態(tài)HTML返回,如果沒有返回錯(cuò)誤頁面(文件系統(tǒng)的存取性能比較低,超過100ms級別,這里沒有使用);
根據(jù)緩存key2是否過期,判斷是否向engine重新發(fā)起渲染(如果你的項(xiàng)目外面接口都支持mq,這個(gè)功能就不需要了).
engine工程職責(zé):
渲染活動頁面,把結(jié)果放到硬盤、redis.
publish工程、mq職責(zé):
頁面發(fā)生變化,向engine重新發(fā)起渲染,具體的頁面邏輯,這里不做講解.
Engine工程的工作就是當(dāng)頁面內(nèi)容發(fā)生變化時(shí),重新渲染頁面,并將整頁內(nèi)容放到redis,或者推送到硬盤.
* view工程架構(gòu)(redis版)
View工程的工作,就是根據(jù)鏈接從redis中獲取頁面內(nèi)容返回.
* view工程架構(gòu) (硬盤版)
兩個(gè)版本對比
Redis版
優(yōu)點(diǎn):接入簡單、性能好,尤其是在大量頁面情況下,沒有性能抖動.單個(gè)dockertps達(dá)到700;
缺點(diǎn):嚴(yán)重依賴京東redis服務(wù),如果redis服務(wù)出現(xiàn)問題,所有頁面都無法訪問.
硬盤版
優(yōu)點(diǎn):不依賴任何其他外部服務(wù),只要應(yīng)用服務(wù)不掛、網(wǎng)絡(luò)正常就可以對外穩(wěn)定服務(wù);在頁面數(shù)量不大的情況下,性能優(yōu)越.單個(gè)dockertps達(dá)到2000;
缺點(diǎn):在頁面數(shù)據(jù)量大的情況下(系統(tǒng)的所有活動頁有xx個(gè)G左右),磁盤io消耗增加(這里采用的javaio,如果采用nginx+lua(OpenResty),io消耗應(yīng)該會控制在10%以內(nèi)).
解決方案
對所有頁面訪問和存儲采用urlhash方式,所有頁面均勻分配到各個(gè)應(yīng)用服務(wù)器上;
采用nginx+lua(OpenResty)利用nginx的異步io,代替javaio.
*Openresty+硬盤版
現(xiàn)在通過nginx+lua(OpenResty)做應(yīng)用服務(wù),所具有的高并發(fā)處理能力、高性能、高穩(wěn)定性已經(jīng)越來越受青睞.通過上述講解,view工程沒有任何業(yè)務(wù)邏輯.可以很輕易的就可以用lua實(shí)現(xiàn),從redis或者硬盤獲取頁面,實(shí)現(xiàn)更高效的web服務(wù).
通過測試對比,view工程讀本地硬盤的速度,比讀redis還要快(同一個(gè)頁面,讀redis是15ms,硬盤是8ms).所以終極版架構(gòu)我選擇用硬盤,redis做備份,硬盤讀不到時(shí)在讀redis.
這里前置機(jī)的urlhash是自己實(shí)現(xiàn)的邏輯,engine工程采用同樣的規(guī)則推送到view服務(wù)器硬盤即可,具體邏輯這里不細(xì)講.后面有時(shí)間再單獨(dú)做一次分享.
優(yōu)點(diǎn):
具備硬盤版的全部優(yōu)點(diǎn),同時(shí)去掉tomcat,直接利用nginx高并發(fā)能力,以及io處理能力;
各項(xiàng)性能、以及穩(wěn)定性達(dá)到最優(yōu).
缺點(diǎn):
硬盤壞掉,影響訪問;
方法監(jiān)控,以及日志打印,需使用lua腳本重寫.
無論是redis版、硬盤版、openresty+硬盤版,基礎(chǔ)都是頁面渲染與頁面瀏覽異步化.
優(yōu)勢:
從事開發(fā)已有近10載,一直就像寄生蟲一樣吸取著網(wǎng)絡(luò)上的資源.前段時(shí)間受“張開濤”大神所托,對活動系統(tǒng)新架構(gòu)做了一次簡單整理分享給大家,希望能給大家?guī)硪唤z幫助.第一次在網(wǎng)上做分享,難免有些沒有考慮周全的地方,以后會慢慢的多分享一些自己的心得,大家一起成長.最后再來點(diǎn)心靈雞湯...
文章出處:開濤的博客(訂閱號ID:kaitao-1234567)
轉(zhuǎn)載請注明本頁網(wǎng)址:
http://www.fzlkiss.com/jiaocheng/4387.html