你是否有過這樣的經(jīng)歷:刷到一家價(jià)格合適、評(píng)價(jià)不錯(cuò)的餐廳,卻發(fā)現(xiàn)門店遠(yuǎn)在城市另一端,交通成本過高,只能無奈劃走。對(duì)于生活服務(wù)類內(nèi)容來說,“感興趣”只是開始,“方便到達(dá)”才是決定下單的關(guān)鍵。
只有同時(shí)滿足“離得近”和“感興趣”,推薦結(jié)果才有可能轉(zhuǎn)化為線下到店與交易。因此,快手生活服務(wù)算法團(tuán)隊(duì)引入大語言模型對(duì)Item進(jìn)行高質(zhì)量的文本語義與地理語義聯(lián)合偏好建模,并通過基于強(qiáng)化學(xué)習(xí)的后訓(xùn)練范式,緩解預(yù)訓(xùn)練 LLM 中普遍存在的“重語義、輕地理”先天偏置,從而使內(nèi)容表征更加充分地適配生活服務(wù)推薦場(chǎng)景。
基于上述思路,快手生活服務(wù)團(tuán)隊(duì)提出了業(yè)界首個(gè)面向近場(chǎng)分發(fā)場(chǎng)景的地理模態(tài)表征建模解決方案——LGSID。

LGSID模型示意圖
本研究相關(guān)成果《LLM-Aligned Geographic Item Tokenization for Local-Life Recommendation》已被人工智能頂級(jí)會(huì)議AAAI 2026接收,同時(shí)LGSID已在快手生活服務(wù)場(chǎng)景全量上線,助力業(yè)務(wù)累計(jì)實(shí)現(xiàn)GMV和訂單10%以上的增長(zhǎng)。
研究核心亮點(diǎn):
在LLM興起前,傳統(tǒng)方法通過離散化的空間特征和特定空間下的用戶興趣建模為模型引入空間感知能力。然而,此類方法強(qiáng)依賴人工特征設(shè)計(jì),離散化的空間特征難以有效刻畫空間位置的相對(duì)關(guān)系,空間感知能力有限。
因此,快手團(tuán)隊(duì)嘗試借助LLM對(duì)Item的地理位置模態(tài)建模,利用自然語言表征與大模型世界知識(shí),從高維語義理解層面刻畫空間位置與相對(duì)關(guān)系,以增強(qiáng)Item自身的空間表達(dá)能力。
教會(huì)LLM如何學(xué)習(xí)地理位置信息
針對(duì)預(yù)訓(xùn)練LLM地理感知能力弱的問題,本文創(chuàng)新性地提出G-DPO算法,通過LLM Post-Training過程,將Item在真實(shí)世界中的相對(duì)空間關(guān)系顯式注入LLM底層,從而引導(dǎo)模型更有效地學(xué)習(xí)地理位置信息,并平衡好內(nèi)容語義與地理語義。
幫助推薦模型更好適配近場(chǎng)分發(fā)
針對(duì)現(xiàn)有單一表征量化無法層次化建模的問題,本文創(chuàng)新性地提出了地理感知層次化量化的方案—HGIT。量化ID的首層通過“硬”的離散化地理位置(GeoHash,經(jīng)緯度)生成初始化聚類,其余層則使用具有地理位置感知能力的內(nèi)容表征逐層殘差量化。
未來,團(tuán)隊(duì)將繼續(xù)深耕近場(chǎng)分發(fā)、多模態(tài)大模型內(nèi)容理解與生成式推薦,探索 AI 賦能下一代推薦系統(tǒng)。重點(diǎn)圍繞多模態(tài)理解、語義量化 ID 與推薦大模型開展創(chuàng)新研究,融合圖像、音頻、視頻等異構(gòu)數(shù)據(jù),提升表征與量化 ID 可解釋性,打造具備時(shí)空推理能力的大模型,為用戶提供更優(yōu)質(zhì)的生活服務(wù)體驗(yàn)。
- QQ:61149512
