生成式召回-TIGER范式

发布于：2025-07-28 ⋅ 阅读:(17) ⋅ 点赞:(0)

TIGER（Transformer Index for GEnerative Recommenders）是生成式召回的经典力作，其核心思想就是语义ID+Seq2Seq，这一范式启发了后续大量生成式推荐工作。

item id是商品在候选库中的独特标识，其具有高度稀疏性，且没有任何物理含义，对于模型训练、新品冷启、可解释性都极不友好。假设一个item的side info足够多，可以完整刻画该item的属性，那么item id完全是可以舍弃的。

TIGER利用多个语义id来表征该item，极大地减少了id embedding词表空间，对工业界生产环境友好；通过模型结构共享相似item的语义信息，提升模型泛化性，利好新品冷启。

痛点	TIGER 的解决方法	优势
embedding 太大 / 存储高	Semantic ID token 数量极小，token vocabulary 可控制	内存友好、减小表规模
冷启动 item embedding 缺失	Semantic ID 来源于 item 内容特征	可推广至新 item，无需训练 embedding
类似 item 无共享	相似内容生成相近的 Semantic ID	用户语义共享，加强泛化
模型检索复杂	Transformer decoder 直接生成	端到端简洁流程

语义id

seq2seq

通过自回归解码生成目标item id，而不是传统embedding + ANN。Transformer的decoder直接输出item的Semantic ID作为推荐结果。

exp
别看实验结果相对值提升很大，很唬人，其实绝对值提升很小。但TIGER范式建模确是一个极大的创新，为生成式推荐打开了思路。