-->
軟硬結(jié)合:快手推薦系統(tǒng)國(guó)內(nèi)率先基于持久內(nèi)存應(yīng)用異構(gòu)存儲(chǔ)
作為2億日活、日均千萬(wàn)級(jí)短視頻上傳、強(qiáng)調(diào)社區(qū)普惠的短視頻APP,快手推薦系統(tǒng)所需解決的技術(shù)挑戰(zhàn)是世界級(jí)的。近日,快手在國(guó)內(nèi)率先應(yīng)用持久內(nèi)存重新設(shè)計(jì)了基于異構(gòu)存儲(chǔ)結(jié)構(gòu)的推薦系統(tǒng),率先采用英特爾?傲騰? 數(shù)據(jù)中心級(jí)持久內(nèi)存。在快手推薦系統(tǒng)高吞吐量大數(shù)據(jù)量請(qǐng)求的場(chǎng)景下,使用持久內(nèi)存可以降低存儲(chǔ)成本,減少故障恢復(fù)時(shí)間,提高系統(tǒng)可靠性。故障恢復(fù)時(shí)間從小時(shí)級(jí)別降低到分鐘級(jí),也為改善大規(guī)模深度機(jī)器學(xué)習(xí)系統(tǒng)在改進(jìn)
2019-08-07 12:14:44
來(lái)源:釘科技??

作為2億日活、日均千萬(wàn)級(jí)短視頻上傳、強(qiáng)調(diào)社區(qū)普惠的短視頻APP,快手推薦系統(tǒng)所需解決的技術(shù)挑戰(zhàn)是世界級(jí)的。近日,快手在國(guó)內(nèi)率先應(yīng)用持久內(nèi)存重新設(shè)計(jì)了基于異構(gòu)存儲(chǔ)結(jié)構(gòu)的推薦系統(tǒng),率先采用英特爾? 傲騰? 數(shù)據(jù)中心級(jí)持久內(nèi)存。在快手推薦系統(tǒng)高吞吐量大數(shù)據(jù)量請(qǐng)求的場(chǎng)景下,使用持久內(nèi)存可以降低存儲(chǔ)成本,減少故障恢復(fù)時(shí)間,提高系統(tǒng)可靠性。故障恢復(fù)時(shí)間從小時(shí)級(jí)別降低到分鐘級(jí),也為改善大規(guī)模深度機(jī)器學(xué)習(xí)系統(tǒng)在改進(jìn)千億級(jí)別數(shù)據(jù)量的處理能力上開(kāi)辟了新的探索方向。

業(yè)界超大規(guī)模實(shí)時(shí)在線短視頻推薦系統(tǒng)

如何在承載高峰期每秒數(shù)十萬(wàn)并發(fā)調(diào)用量的同時(shí),從上百億級(jí)別的短視頻庫(kù)中,通過(guò)千億參數(shù)級(jí)別的深度模型將內(nèi)容展現(xiàn)給用戶?快手推薦團(tuán)隊(duì)設(shè)計(jì)了基于異構(gòu)設(shè)備的先進(jìn)推薦系統(tǒng),其中遇到問(wèn)題的復(fù)雜程度極富挑戰(zhàn)。

目前快手推薦系統(tǒng)采用的是計(jì)算與存儲(chǔ)分離的架構(gòu)模式(如下圖所示)。推薦系統(tǒng)中的存儲(chǔ)型服務(wù)主要是用來(lái)存儲(chǔ)和實(shí)時(shí)更新上億規(guī)模的用戶畫(huà)像、數(shù)十億規(guī)模的短視頻特征、以及千億規(guī)模的排序模型參數(shù)。計(jì)算型服務(wù)主要進(jìn)行的是視頻召回檢索、推薦模型預(yù)估和推薦策略計(jì)算。

圖片1.png【快手推薦系統(tǒng)采用計(jì)算和存儲(chǔ)分離的架構(gòu)】

2018年到2019年上半年,快手推薦架構(gòu)團(tuán)隊(duì)的主要工作集中在利用異構(gòu)混合計(jì)算的方式,提升推薦系統(tǒng)中模型預(yù)估和召回檢索等計(jì)算密集型業(yè)務(wù)的性能。通過(guò)利用異構(gòu)計(jì)算的改造,產(chǎn)生了數(shù)倍的性能提升,鼓舞了快手推薦架構(gòu)團(tuán)隊(duì)向異構(gòu)系統(tǒng)設(shè)計(jì)中更難的存儲(chǔ)問(wèn)題進(jìn)發(fā)。

一直以來(lái),快手推薦團(tuán)隊(duì)致力于推薦系統(tǒng)架構(gòu)調(diào)整,力求在日益增長(zhǎng)的用戶量沖擊下,使推薦系統(tǒng)高可用的前提下,實(shí)時(shí)、高效、精準(zhǔn)地向用戶推薦優(yōu)質(zhì)內(nèi)容。

新機(jī)遇:軟硬結(jié)合極致優(yōu)化,探索異構(gòu)存儲(chǔ)

持久內(nèi)存是介于DRAM和SSD間的新存儲(chǔ)層級(jí),不僅能提供接近DRAM的延遲,同時(shí)還提供持久化和更大容量的存儲(chǔ)空間,這為推薦系統(tǒng)中不同場(chǎng)景的可行性分析和架構(gòu)設(shè)計(jì)提供了思路。

相比于傳統(tǒng)的內(nèi)存加硬盤(pán)的兩級(jí)存儲(chǔ),新存儲(chǔ)設(shè)備的推出,現(xiàn)代服務(wù)器可以利用的存儲(chǔ)層級(jí)越來(lái)越多,利用多層級(jí)存儲(chǔ)的軟件系統(tǒng)設(shè)計(jì)也變得越來(lái)越復(fù)雜。每種存儲(chǔ)設(shè)備有不同的性能特性和容量大小限制,越快的設(shè)備的單位容量成本越高。例如使用內(nèi)存插槽的英特爾? 傲騰? 數(shù)據(jù)中心級(jí)持久內(nèi)存,依據(jù)讀寫(xiě)粒度的不同,讀寫(xiě)帶寬雖小于傳統(tǒng)內(nèi)存,但寫(xiě)入數(shù)據(jù)具有持久性,且容量遠(yuǎn)大于傳統(tǒng)內(nèi)存。如何結(jié)合不同層級(jí)的存儲(chǔ)設(shè)計(jì)在大規(guī)模推薦場(chǎng)景下性價(jià)比最優(yōu)的存儲(chǔ)系統(tǒng)成為一個(gè)巨大機(jī)遇和挑戰(zhàn)。

圖片2.png

 【新一代服務(wù)器的存儲(chǔ)層級(jí)結(jié)構(gòu)】

快手聯(lián)合英特爾,國(guó)內(nèi)業(yè)界率先落地采用英特爾? 傲騰? 數(shù)據(jù)中心級(jí)持久內(nèi)存的異構(gòu)存儲(chǔ)到推薦系統(tǒng)

基于多層級(jí)異構(gòu)存儲(chǔ)設(shè)備,快手推薦團(tuán)隊(duì)聯(lián)合系統(tǒng)運(yùn)營(yíng)部硬件選型研發(fā)團(tuán)隊(duì)針對(duì)推薦系統(tǒng)中的不同場(chǎng)景進(jìn)行了可行性分析和架構(gòu)設(shè)計(jì)的調(diào)研。針對(duì)持久內(nèi)存的特性,對(duì)分布式索引和參數(shù)服務(wù)器中的KV存儲(chǔ)進(jìn)行了重新設(shè)計(jì)。

圖片3.png

【基于持久性內(nèi)存的KV系統(tǒng)設(shè)計(jì)示意圖】,注:AEP指代英特爾? 傲騰? 數(shù)據(jù)中心級(jí)持久內(nèi)存

該設(shè)計(jì)主要通過(guò)為KV存儲(chǔ)增加MemPool組件,針對(duì)不同訪問(wèn)類(lèi)型來(lái)決定系統(tǒng)是訪問(wèn)DRAM緩存,還是直接讀取持久內(nèi)存。比如說(shuō),在推薦模型預(yù)估的參數(shù)服務(wù)器這個(gè)場(chǎng)景中,由于模型中神經(jīng)網(wǎng)絡(luò)大小與Embedding Table相比很小,所以神經(jīng)網(wǎng)絡(luò)也會(huì)被MemPool直接分配進(jìn)入DRAM來(lái)提高預(yù)估的性能。

除此之外,推薦團(tuán)隊(duì)還對(duì)KV系統(tǒng)進(jìn)行了調(diào)優(yōu):

對(duì)于數(shù)據(jù)讀取場(chǎng)景采用NUMA節(jié)點(diǎn)綁定的方式使得持久內(nèi)存訪問(wèn)不跨NUMA節(jié)點(diǎn),從而獲得更好的讀寫(xiě)性能;采用ZeroCopy技術(shù)對(duì)內(nèi)存和持久內(nèi)存進(jìn)行訪問(wèn);使用無(wú)鎖技術(shù),減少臨界區(qū)中對(duì)持久內(nèi)存的訪問(wèn)來(lái)提高性能。經(jīng)過(guò)上述的技術(shù)改進(jìn),我們將基于持久內(nèi)存的索引系統(tǒng)用真實(shí)的線上請(qǐng)求數(shù)據(jù)進(jìn)行模擬壓測(cè)。測(cè)試結(jié)果如下:

QQ截圖20190807121120.png

 【基于持久性內(nèi)存索引系統(tǒng)的壓力測(cè)試結(jié)果】

基于異構(gòu)存儲(chǔ)的索引系統(tǒng)幾乎達(dá)到純DRAM的索引系統(tǒng)相同的性能指標(biāo),但總體擁有成本降低30%。同時(shí)異構(gòu)存儲(chǔ)的索引系統(tǒng)能夠提供分鐘級(jí)別的故障恢復(fù)速度,比之前小時(shí)級(jí)別的恢復(fù)提升了百倍恢復(fù)速度。英特爾專(zhuān)家介紹,快手是國(guó)內(nèi)率先在推薦系統(tǒng)領(lǐng)域中引入并使用基于持久內(nèi)存的異構(gòu)存儲(chǔ)的互聯(lián)網(wǎng)公司,這種創(chuàng)新實(shí)踐的技術(shù)能力讓我們側(cè)目。

快手推薦打造業(yè)界頂級(jí)、戰(zhàn)斗力強(qiáng)悍的技術(shù)團(tuán)隊(duì)

通過(guò)工程、算法結(jié)合,數(shù)據(jù)驅(qū)動(dòng)的手段,讓快手推薦系統(tǒng)更高效、更精準(zhǔn)、更穩(wěn)定地為快手?jǐn)?shù)億用戶服務(wù),記錄每一個(gè)人的生活點(diǎn)滴,并讓每一個(gè)人的記錄都能引起共鳴。推薦架構(gòu)團(tuán)隊(duì)的成員都來(lái)自國(guó)內(nèi)知名大學(xué)、甚至國(guó)際知名大學(xué),如CMU、清華、北大、中科大等著名院校的畢業(yè)生。團(tuán)隊(duì)每個(gè)成員都追求技術(shù)極致,具備一流的分布式高并發(fā)服務(wù)的開(kāi)發(fā)能力,比如在線分布式索引支持每天千億級(jí)別的視頻請(qǐng)求、機(jī)器學(xué)習(xí)平臺(tái)支持千億級(jí)別的推薦模型在線學(xué)習(xí)和在線預(yù)估、在線服務(wù)為數(shù)億用戶提供99.99%的可用性。

原創(chuàng)文章
最新文章
1
同樣是電視,為什么長(zhǎng)虹的畫(huà)質(zhì)更驚艷?答案在調(diào)校里
2
蘋(píng)果正式回應(yīng)iPhone半夜偷打電話bug:iOS 26.3已修復(fù)
3
正式回歸OPPO體系 真我商城宣布4月25日停止運(yùn)營(yíng)
4
2026開(kāi)年筆記本電腦線上銷(xiāo)量榜出爐:華為、小米未進(jìn)前5
5
2025電動(dòng)兩輪車(chē)線上洗牌:九號(hào)力壓小牛登頂,雅迪愛(ài)瑪退居腰部
6
AWE上生態(tài)破局 :探路品牌五年狂飆突進(jìn),靠的不只是產(chǎn)品?
7
從三維出行到居家日常 :探路生態(tài)2026AWE首秀 引領(lǐng)新一輪出行革命?
8
從智能出行到智能家電,探路生態(tài)攜智能空間全棧產(chǎn)品矩陣亮相AWE
9
央視、張朝陽(yáng)、36氪都來(lái)了,探路生態(tài)AWE首秀刷屏
10
暢銷(xiāo)海外!MOVA割草機(jī)器人登頂亞馬遜多國(guó)Best Sellers榜首
11
2026年體育大年推動(dòng)電視熱銷(xiāo),預(yù)計(jì)4月液晶電視面板漲價(jià)
12
凈利再創(chuàng)歷史新高 TCL智家海外業(yè)務(wù)突破144億
13
華為 Pura X新配色曝光:型格橙、型格紫將至,小折疊再添新選擇
14
蘋(píng)果iOS 26.4正式版發(fā)布!大量新功能上線 國(guó)行AI繼續(xù)缺席
15
撕掉便宜、低端標(biāo)簽!中國(guó)高端手機(jī)市場(chǎng)小米占27.1% 6-8000元取得突破
16
小米空調(diào)一年賣(mài)出850萬(wàn)臺(tái),行業(yè)格局真要變了?
17
快手聯(lián)合杜海濤打造獨(dú)家求職直播IP《你的濤來(lái)了》,饒雪漫首場(chǎng)空降助力普通人職場(chǎng)圓夢(mèng)
18
快手電商機(jī)構(gòu)大會(huì)發(fā)布「啟源計(jì)劃」,揭秘2026增長(zhǎng)新密碼
19
十年舊機(jī)暴漲近8倍!芯片短缺帶動(dòng)舊手機(jī)回收價(jià)一路飆升
20
戰(zhàn)略升級(jí)!宇樹(shù)科技錨定全球領(lǐng)先 全鏈路布局夯實(shí)增長(zhǎng)根基
關(guān)于我們

微信掃一掃,加關(guān)注

商務(wù)合作
  • QQ:61149512