谷歌在 YouTube 上利用 Transformer 架构进行音乐推荐

科技 2024-09-14 10:16 辽宁

作者 | Sergio De Simone

译者 | 明知山

策划 | Tina

谷歌介绍了一种将 Transformer 模型应用于音乐推荐的创新方法。目前，这一技术正在 YouTube 上进行试验性部署，目标是开发出一种能够理解用户在听音乐时的行为模式的推荐系统，通过分析用户的实时互动数据更好地理解用户偏好。

推荐系统通过分析用户的行为——如播放音乐、跳过曲目或对某首歌曲表示喜爱——来捕捉用户偏好，并据此推荐用户可能感兴趣的内容。

谷歌研究团队指出，音乐推荐系统在用户所处环境发生变化时常常表现不佳，例如从在家里听音乐变成在健身房听音乐。这种场景转换可能伴随着用户偏好从舒缓音乐转到更具活力的音乐。研究人员强调，尝试将这些上下文变化考虑在内，导致推荐系统要完成的任务变得更加困难，因为它们需要理解用户在当前上下文中的行为。

他们认为，Transformer 架构在这方面可能会有所用处，因为它特别适合理解输入数据序列，正如自然语言处理（NLP）和大语言模型（LLM）所证实的。谷歌研究团队相信，Transformer 架构有望展现出与理解基于用户上下文的语言相同的能力，从而深入洞察用户的行为序列。

自注意力层能够捕捉句子中单词之间的关系，这表明它们可能具备解析用户行为联系的潜力。在 Transformer 模型中，注意力层通过学习输入 Token 之间的权重分配，类似于分析句子中单词的关系，从而实现对用户行为序列的理解。

谷歌研究团队的目标是将 Transformer 架构从生成式模型转变为理解基于当前上下文的用户行为序列。这种理解随后与个性化排名模型相结合，生成精准的推荐。为了解释用户行为在不同上下文中可能具有的不同含义，研究人员以在健身房听音乐的用户为例，指出他们可能更偏好节奏感强的音乐。而在家中，这类音乐可能会被跳过。因此，在健身房时，推荐系统应降低对这种行为的关注权重。换句话说，推荐系统需要在考虑用户特定上下文与整体用户音乐收听记录之间合理分配注意力权重。

我们仍然会利用他们之前听过的音乐记录，并推荐与他们常听的音乐相似的曲目。实际上，我们正在探索哪些历史记录对于当前音乐排序任务是有价值的，以及哪些不是。

作为对谷歌推荐系统工作原理的简要总结，基于 Transformer 的系统遵循推荐系统的典型流程，分为三个主要阶段：首先从资料库检索项目，然后根据用户行为对项目进行排序，最后通过筛选减少展示给用户的选项。在对项目进行排名时，系统将 Transformer 技术与现有的排名模型相结合。每首歌曲都关联一个叫作“曲目嵌入”的向量，该向量同时用于 Transformer 和排名模型。与用户行为和曲目元数据相关的信号被映射到等长的向量，使得它们能够像曲目嵌入一样处理。例如，当向 Transformer 提供输入时，用户行为嵌入和音乐曲目嵌入会被相加，形成一个 Token。最终，Transformer 的输出与排名模型的输出通过多层神经网络进行融合。

谷歌研究人员的初步实验结果表明，推荐系统的性能得到了提升，具体表现为用户跳过率的降低和音乐播放时间的增加。

查看英文原文：

https://www.infoq.com/news/2024/09/transofrmer-based-recommender/

声明：本文为 InfoQ 翻译整理，未经许可禁止转载。

今日好文推荐

下载量超 5000 万的知名应用，开发团队“全军覆没”，从此发版人唯剩老板一个

RAG风口十问：大数据与AI是价值落地还是过度炒作？

机房锂电池火灾致阿里云服务瘫痪，超 30 小时灭火仍未结束：持续浇水，数据中心成“危楼”！？

又“刑”了！搞瘫公司三千多工作电脑，不给 500 万就删 IT 账户，网友：快乐的员工谁干这事儿啊

http://mp.weixin.qq.com/s?__biz=MjM5MDE0Mjc4MA==&mid=2651218840&idx=4&sn=ca93835479ab17c5d7d9c582f7344564

InfoQ

为一线互联网公司核心技术人员提供优质内容。科技圈的观察者，前沿技术的传播者。

最新文章

美国大选倒计时：软件崩溃、密码泄漏，投票系统研发人员比候选人更“焦虑”？

从社区数据看大模型开发生态的全景与趋势

科大讯飞大模型竞速2年多，答卷不只是语音

值得开发者好好看一看的AI大模型入门教程（内含300道AI面试真题）｜极客时间

微软将斥巨资 700 多亿元，从 AI 初创公司 CoreWeave 租用服务器

麦当劳中国：打造 MACH 架构的数字化巨无霸

122 天打造的奇迹：深入探访 xAI 的 10 万块 GPU 超级 AI 计算机集群

直播预约｜登顶 TPC-DS！数据库 MPP 架构的极致优化与产业化实践

在现代应用中确证 Cell-Based 架构的安全性

PostgreSQL 17 发布，改进了清理进程并提高了性能

“前端”架构真的有必要存在吗？

偷钱近 5 年，不断说谎、给同事挖坑！Python 协会被财务主管“背刺”：账户只剩 26 美元，差点破产！

RAG 驱动的 Copilot 为 Uber 节省了 13,000 个工程小时

JetBrains 推出免费的 Rider 非商业许可

C/C++ 大限将至？美政府给出最强硬要求：2026 年前关键软件必须开始全面去 C

Q资讯 | 互撕升级！微软长文炮轰谷歌；京东接入支付宝！网友：史诗级和好；网盘祖师爷Dropbox裁员20%

一键取代谷歌成默认搜索引擎！ChatGPT搜索功能深夜炸场，奥特曼加速将谷歌逼向死亡

曹操出行再次冲击港股IPO，预计两年内推出完全定制化Robotaxi车型

受软件拖累，大众血亏155亿元：直接把奥迪、宾利、杜卡迪和兰博基尼等豪车利润抹平了

阿里云 AI 搜索 RAG 大模型优化实践

纯 AI 厂商早过时了！Runway CEO “手撕”大模型厂商标签，招兵买马开始转型

利用 Cell-Based 架构构建具有弹性和容错性的系统

谷歌超四分之一代码由 AI 生成，CEO：我们的收入甚至超过了华尔街！

低级失误导致 Elasticsearch 仓库 404，7万多 star 一夜清空，网友：只是手滑了？！

寻找 AI 最佳实践，InfoQ 2024 中国技术力量年度榜单开启

大模型如何打通行业应用落地“最后一公里”？｜AICon

vivo 轩辕文件系统：AI 计算平台存储性能优化实践

微软工程师介绍了Git中一个会导致代码库膨胀的缺陷，修复方案即将推出

Flutter 被分叉！团队缩水至 50 人，bug 堆积如山，前谷歌员工出手找出路

中国存储厂，杀入顶分桌

Apple Intelligence 终于实装 iOS 18.1，用上的第一批用户已经开骂了？

SQLite 将从 GNU Autotools 迁移到 Autosetup，团队警告新版可能出现“某些构建级别的中断”

Kotlin HTTP Toolkit Ktor 3.0改进性能，并支持服务器发送事件

大模型应用开发，AI 厂商开启新一轮“群雄逐鹿”？

从架构角度认识 AI：为架构师解读机器学习与生成增强技术

今日直播｜从魔法到现实，生成式 AI 如何重塑数字化人才？

JavaScript 应该分成两种语言吗？谷歌新提案引争议

谷歌云为 Valkey 和 Redis 集群的 Memorystore 添加了可扩展的向量搜索

开源的定义要变了！开源AI标准成照妖镜：Meta、谷歌家大模型只是在假装开源？

语言模型驱动的软件工具思考：可解释与可溯源

咱就是说，QCon 上海 2024 叫好又叫座的演讲是哪些人干出来的？

昔日好友反目，Arm、高通疯狂“互掐”！最新回应：我们都不忍了，打官司！

放弃 React，微软 Edge 团队改用 Web 组件减少对 JavaScript 的依赖

微软制霸 AI 编程？GitHub被曝秘密开发Copilot专属 API，“杀死”Cursor和一众Copilot开源替代！

优化 Wellhub 的自动完成服务的延迟：多区域架构

Podman Desktop 1.13发布，支持Hyper-V

字节跳动海外招聘人数惊人，是Meta的6倍；一家曾获千万融资的AI创企解散了；Vision Pro或在年底前彻底停产 | Q资讯

单元化架构在字节跳动的落地实践

大模型驱动行业升级，医疗、生产力工具与企业应用的实践探讨 | 直播预告

百度又放大招！视觉生成模型 Hallo2 或将落地数字人等场景

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉