你是否有过这样的经历:刷到一家价格合适、评价不错的餐厅,却发现门店远在城市另一端,交通成本过高,只能无奈划走。对于生活服务类内容来说,“感兴趣”只是开始,“方便到达”才是决定下单的关键。
只有同时满足“离得近”和“感兴趣”,推荐结果才有可能转化为线下到店与交易。因此,快手生活服务算法团队引入大语言模型对Item进行高质量的文本语义与地理语义联合偏好建模,并通过基于强化学习的后训练范式,缓解预训练 LLM 中普遍存在的“重语义、轻地理”先天偏置,从而使内容表征更加充分地适配生活服务推荐场景。
基于上述思路,快手生活服务团队提出了业界首个面向近场分发场景的地理模态表征建模解决方案——LGSID。

LGSID模型示意图
本研究相关成果《LLM-Aligned Geographic Item Tokenization for Local-Life Recommendation》已被人工智能顶级会议AAAI 2026接收,同时LGSID已在快手生活服务场景全量上线,助力业务累计实现GMV和订单10%以上的增长。
研究核心亮点:
在LLM兴起前,传统方法通过离散化的空间特征和特定空间下的用户兴趣建模为模型引入空间感知能力。然而,此类方法强依赖人工特征设计,离散化的空间特征难以有效刻画空间位置的相对关系,空间感知能力有限。
因此,快手团队尝试借助LLM对Item的地理位置模态建模,利用自然语言表征与大模型世界知识,从高维语义理解层面刻画空间位置与相对关系,以增强Item自身的空间表达能力。
教会LLM如何学习地理位置信息
针对预训练LLM地理感知能力弱的问题,本文创新性地提出G-DPO算法,通过LLM Post-Training过程,将Item在真实世界中的相对空间关系显式注入LLM底层,从而引导模型更有效地学习地理位置信息,并平衡好内容语义与地理语义。
帮助推荐模型更好适配近场分发
针对现有单一表征量化无法层次化建模的问题,本文创新性地提出了地理感知层次化量化的方案—HGIT。量化ID的首层通过“硬”的离散化地理位置(GeoHash,经纬度)生成初始化聚类,其余层则使用具有地理位置感知能力的内容表征逐层残差量化。
未来,团队将继续深耕近场分发、多模态大模型内容理解与生成式推荐,探索 AI 赋能下一代推荐系统。重点围绕多模态理解、语义量化 ID 与推荐大模型开展创新研究,融合图像、音频、视频等异构数据,提升表征与量化 ID 可解释性,打造具备时空推理能力的大模型,为用户提供更优质的生活服务体验。
- QQ:61149512
