你是否有過這樣的經(jīng)歷:刷到一家價格合適、評價不錯的餐廳,卻發(fā)現(xiàn)門店遠在城市另一端,交通成本過高,只能無奈劃走。對于生活服務(wù)類內(nèi)容來說,“感興趣”只是開始,“方便到達”才是決定下單的關(guān)鍵。
只有同時滿足“離得近”和“感興趣”,推薦結(jié)果才有可能轉(zhuǎn)化為線下到店與交易。因此,快手生活服務(wù)算法團隊引入大語言模型對Item進行高質(zhì)量的文本語義與地理語義聯(lián)合偏好建模,并通過基于強化學(xué)習(xí)的后訓(xùn)練范式,緩解預(yù)訓(xùn)練 LLM 中普遍存在的“重語義、輕地理”先天偏置,從而使內(nèi)容表征更加充分地適配生活服務(wù)推薦場景。
基于上述思路,快手生活服務(wù)團隊提出了業(yè)界首個面向近場分發(fā)場景的地理模態(tài)表征建模解決方案——LGSID。

LGSID模型示意圖
本研究相關(guān)成果《LLM-Aligned Geographic Item Tokenization for Local-Life Recommendation》已被人工智能頂級會議AAAI 2026接收,同時LGSID已在快手生活服務(wù)場景全量上線,助力業(yè)務(wù)累計實現(xiàn)GMV和訂單10%以上的增長。
研究核心亮點:
在LLM興起前,傳統(tǒng)方法通過離散化的空間特征和特定空間下的用戶興趣建模為模型引入空間感知能力。然而,此類方法強依賴人工特征設(shè)計,離散化的空間特征難以有效刻畫空間位置的相對關(guān)系,空間感知能力有限。
因此,快手團隊嘗試借助LLM對Item的地理位置模態(tài)建模,利用自然語言表征與大模型世界知識,從高維語義理解層面刻畫空間位置與相對關(guān)系,以增強Item自身的空間表達能力。
教會LLM如何學(xué)習(xí)地理位置信息
針對預(yù)訓(xùn)練LLM地理感知能力弱的問題,本文創(chuàng)新性地提出G-DPO算法,通過LLM Post-Training過程,將Item在真實世界中的相對空間關(guān)系顯式注入LLM底層,從而引導(dǎo)模型更有效地學(xué)習(xí)地理位置信息,并平衡好內(nèi)容語義與地理語義。
幫助推薦模型更好適配近場分發(fā)
針對現(xiàn)有單一表征量化無法層次化建模的問題,本文創(chuàng)新性地提出了地理感知層次化量化的方案—HGIT。量化ID的首層通過“硬”的離散化地理位置(GeoHash,經(jīng)緯度)生成初始化聚類,其余層則使用具有地理位置感知能力的內(nèi)容表征逐層殘差量化。
未來,團隊將繼續(xù)深耕近場分發(fā)、多模態(tài)大模型內(nèi)容理解與生成式推薦,探索 AI 賦能下一代推薦系統(tǒng)。重點圍繞多模態(tài)理解、語義量化 ID 與推薦大模型開展創(chuàng)新研究,融合圖像、音頻、視頻等異構(gòu)數(shù)據(jù),提升表征與量化 ID 可解釋性,打造具備時空推理能力的大模型,為用戶提供更優(yōu)質(zhì)的生活服務(wù)體驗。
- QQ:61149512
