LLM 推荐系统的最新创新

发布于:2024-10-12 ⋅ 阅读:(6) ⋅ 点赞:(0)

随着大型语言模型 (LLM) 的出现,技术正在迅速发展,尤其是改变了推荐系统。从 QQ 音乐播放的下一首歌曲到刷抖音,推荐系统影响着各种用户体验。通过预测用户偏好,推荐系统可以提高用户满意度,并通过保持内容的相关性和吸引力来提高参与度。

最近,随着大型语言模型 (LLM) 的出现,推荐系统经历了阶梯式的功能改进。这些模型正在改变用户体验和排名。然而,将 LLM 直接集成到生产环境中带来了挑战,主要是由于高延迟问题。正因为如此,LLM 通常被用来增强系统的其他组件,而不是直接使用。

在本文中,我们将探讨 LLM 如何改变推荐系统。让我们先从一个简单的概述开始。

图片

现代推荐系统概述

现代推荐系统通常以四阶段循环运行:

  1. 输入处理和特征生成:此阶段处理来自用户交互的数据——包括评论和评分等显式信号,以及点击等隐式信号——将它们转换为相关特征以进行推荐。
  2. 候选生成:收到用户请求后,系统从庞大的语料库中检索潜在推荐的初始列表,例如视频和音乐。虽然传统系统可能使用关键字匹配来查找与用户输入或搜索词直接对应的项目,但现代技术通常采用更复杂的算法,例如基于嵌入的检索。
  3. 候选排名:每个候选都根据相关性函数进行评分。预测模型(例如双塔神经网络)用于将用户和候选数据转换为嵌入。然后通过计算这些嵌入之间的相似性来确定相关性。
  4. 用户交互和数据收集:排名后的推荐呈现给用户,用户通过单击或忽略项目进行交互。然后收集这些交互以改进和完善未来的模型。

图片

大型语言模型 (LLM) 在推荐系统中的应用可分为两大类:判别型和生成型。

  1. 判别型案例:BERT 等传统 LLM 用于对特定结果进行分类或预测,侧重于对用户输入进行分类或根据预定义类别预测用户行为。
  2. 生成型案例:最近的发展集中在 GPT 等模型上,这些模型能够以人类可读的文本生成新内容或建议。

我们将探索生成型应用,其中使用 GPT-4 和 LLaMA 3.1 等高级模型来增强每个阶段的推荐系统。

LLM 在推荐系统中的适用范围

随着推荐系统的发展,大型语言模型 (LLM) 的战略整合变得越来越重要。本节探讨了有关 LLM 如何在推荐流程的各个阶段进行调整的一些最新研究。

1. 特征生成

特征增强

LLM 可用于为用户或项目生成特定特征。例如,考虑产品分类研究中使用的方法(请参阅本文中描述的模式)。该模型采用结构化指令,其中包括任务描述、提示、输入文本、候选标签、输出约束和期望输出等组件。这种结构化方法有助于生成针对特定推荐任务的精确特征。可以使用少量学习和微调策略进一步使大型语言模型适应特定任务。

  • 少量学习:这种方法通过为 LLM 提供提示中的几个示例来“训练”它完成一项新任务,利用其预先训练的知识快速适应。
  • 微调:该技术涉及在更大的特定于任务的数据集上对预训练模型进行额外训练,以通过调整新任务来提高其性能。

图片

合成标签生成

合成数据生成涉及创建逼真的人工数据条目以用于训练目的,如本研究所示。该过程涉及两个主要步骤:

  1. 上下文设置:此初始步骤建立特定领域的上下文来指导数据生成。例如,使用诸如“想象你是一名电影评论家”之类的提示有助于为生成与电影评论相关的数据设置场景。
  2. 数据生成提示:设置上下文后,LLM 将获得有关所需输出的具体说明。这包括有关文本样式(例如电影评论)、情绪(正面或负面)以及任何限制(如字数或特定术语)的详细信息。这可确保合成数据与推荐系统的要求紧密结合,从而使其有助于提高其准确性和有效性。

图片

2. 候选生成

检索旨在为目标用户选择一组潜在候选,然后从大量语料库中对其进行排序。检索机制主要有两种:

  • 词袋检索:将文本转换为词频向量,并通过测量这些频率向量与用户之间的相似性(例如余弦相似性)来检索文档。
  • 基于嵌入的检索:将文本转换为密集语义嵌入,并通过比较用户和文档嵌入之间的语义相似性(余弦相似性)来检索文档。

LLM 增强检索

LLM 通过添加合成文本(本质上是增强用户请求)来增强词袋和基于嵌入的检索,以更好地表示用户端和文档端的嵌入。每个用户请求查询都用类似的查询进行增强,以改进检索。

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

3. 排名

候选评分任务

候选评分任务涉及利用 LLM 作为逐点函数,为每个目标用户 u 和候选集 C 中的每个候选 c 分配一个分数。通过对候选集中的每个项目的效用分数进行排序,生成项目的最终排名列表。

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

其中 k1,k2…kn 是经过排名的候选列表。

对于候选评分任务,主要使用三种方法:

方法 1:知识提炼

此方法采用双模型策略,学生模型(通常是较小的语言模型)从更复杂的教师模型(例如 LLaMA 3.1)生成的数据集中学习,通常通过整合用户属性来增强。再次使用诸如少样本学习和微调之类的技术将 LLM 适应特定领域案例,使学生模型能够有效模仿教师的表现,同时提高效率。这种方法不仅提高了模型的可扩展性,而且由于仅使用较小的模型进行推理,因此保持了高性能。

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

方法 2:分数生成

分数生成技术涉及 LLM 直接从给定的提示生成分数,然后可以通过缓存机制公开这些分数,根据这些分数对项目进行排名。

方法 3:根据 LLM 预测分数

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

在这种方法中,候选评分任务被转化为二元问答挑战。该过程从用户个人资料、行为和目标项目的详细文本描述开始。然后,模型回答旨在确定用户偏好的问题,生成估计分数或概率。为了改进这种方法,修改包括用多层感知器 (MLP) 替换 LLM 的解码器层进行预测,或对“是”或“否”等二元答案的对数使用二维 softmax 函数来计算分数(参见本研究)。这将复杂的评分任务简化为简单的二元分类问题。

候选生成任务

在项目生成任务中,大型语言模型充当生成机制,提供最终排名的项目列表,而不是根据分数对其进行排序。因此,对于每个目标用户 u,以及对于候选集 C 中的每个候选 c,排名列表 k1,k2…kn 变为:

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

该方法主要依赖于 LLM 固有的推理能力来评估用户偏好并生成适当排序的建议列表。

然后可以使用此排序列表来缓存最常出现的用户/请求,并通过批处理对其进行更新。

4. 用户交互和数据收集

LLM 正在以多种重要且引人注目的方式改进推荐系统中的用户体验。也许最具变革性的应用是将推荐过程直接嵌入到对话界面中,例如 Perplexity 等对话搜索引擎的情况。正如本研究中所讨论的,由 LLM 驱动的聊天机器人在基于属性的对话上进行了微调,其中机器人在提出建议之前会询问用户的偏好,这代表了推荐传递方式的重大转变。这种方法直接利用了 LLM,超越了增强现有模型。

它引入了一种新范式,其中检索增强生成 (RAG) 等技术发挥着至关重要的作用。在推荐系统的背景下,特别是集成到对话代理中的推荐系统,RAG 可以通过提取相关且及时的信息来提供帮助,从而根据用户当前的上下文或查询提出更明智的建议。

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

最后

在最近的研究中,我们看到 LLM 正在重塑推荐系统,尽管高延迟等挑战阻碍了它们成为主要的推理模型。虽然 LLM 目前支持后端改进特征生成和预测准确性,但计算效率量化等持续进步最终将缓解延迟问题。这将使 LLM 能够直接集成,大大提高其响应能力并提供无缝、直观的体验,从而改善用户体验。

那么,如何系统的去学习大模型LLM?

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

作为一名热心肠的互联网老兵,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。

但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

所有资料 ⚡️ ,朋友们如果有需要全套 《LLM大模型入门+进阶学习资源包》,扫码获取~
在这里插入图片描述

篇幅有限,部分资料如下:

👉LLM大模型学习指南+路线汇总👈

💥大模型入门要点,扫盲必看!
在这里插入图片描述
💥既然要系统的学习大模型,那么学习路线是必不可少的,这份路线能帮助你快速梳理知识,形成自己的体系。
在这里插入图片描述

👉大模型入门实战训练👈

💥光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
在这里插入图片描述

👉国内企业大模型落地应用案例👈

💥《中国大模型落地应用案例集》 收录了52个优秀的大模型落地应用案例,这些案例覆盖了金融、医疗、教育、交通、制造等众多领域,无论是对于大模型技术的研究者,还是对于希望了解大模型技术在实际业务中如何应用的业内人士,都具有很高的参考价值。 (文末领取)
在这里插入图片描述
💥《2024大模型行业应用十大典范案例集》 汇集了文化、医药、IT、钢铁、航空、企业服务等行业在大模型应用领域的典范案例。

在这里插入图片描述

👉LLM大模型学习视频👈

💥观看零基础学习书籍和视频,看书籍和视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。 (文末领取)
在这里插入图片描述

👉640份大模型行业报告👈

💥包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。
在这里插入图片描述

👉获取方式:

这份完整版的大模型 LLM 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

😝有需要的小伙伴,可以Vx扫描下方二维码免费领取🆓
在这里插入图片描述