X-LANCE 宣传组 语音之家 2025年02月26日 18:03 北京
Xmart青年论坛由上海交通大学跨媒体语言智能实验室(SJTU X-LANCE lab)创办,中国计算机学会语音对话专委会主办,语音之家协办,旨在邀请国内外优秀的青年学者分享其最新科研工作和成果,促进多元且深入的交流与合作。Xmart学生论坛作为其中一个系列,致力于邀请国内外知名高校有成体系工作的研究生,主要通过线上分享的方式,系统地介绍其科研成果和心得,为青年学生打造一个学术探讨,思维碰撞和多学科交叉融合的平台。
Xmart•学生论坛丨袁锐斌:Scaling Foundation Models for Music
形式:线上
时间:2月28日(周五) 14:00 ~ 16:00
报告嘉宾
袁锐斌
袁锐斌,香港科技大学(HKUST)交叉学科研究部(EMIA)的博士生,硕士毕业于卡耐基梅隆大学(CMU)。他致力于向通用人工智能注入艺术和创造力,研究方向包括大模型、生成式人工智能、音乐生成与理解基础模型。他在ICLR / NeurIPS / CVPR / ACL / ISMIR / COLM / INTERSPEECH 等顶级学术会议发表多篇论文,论文总引用量上千次。他联合创办了AIGC开源学术社区Multimodal Art Projection (M-A-P),参与或领导许多有影响力的开源学术项目,如MMMU, MERT, YuE, ChatMusician, MAP-NEO, AnyGPT等。
报告摘要
音乐是跨越人类文明的通用语言,与创造力、文化和情感深度融合。本次演讲将分享我们在构建开源音乐基础模型过程中的探索历程。我们秉持"AGI不仅应理解与创作音乐,也应从音乐学习中受益"的愿景,系统性地推进音乐智能研究。首先介绍业界广泛应用的MERT——基于音频模态的音乐理解模型。随后展示如何将符号音乐理解与生成能力融入LLaMA框架,实现自然语言与符号表征的统一建模(ChatMusician)。演讲的核心将聚焦最新突破:通过数万亿token训练构建的90亿参数音乐生成基座YuE(乐),这是当前最强大的开源全曲级歌曲生成模型(类Suno)。我们将同步分享模型研发中的关键洞见、实践经验,以及在通往音乐×AGI道路上仍需攻克的技术挑战。
参加方式
①
直播将通过语音之家微信视频号进行直播
手机端、PC端可同步观看
👇👇👇
②
腾讯会议参加
会议号:239-115-417
实 验 室 介 绍
上海交通大学跨媒体语言智能实验室(SJTU Cross Media Language Intelligence Lab, X-LANCE)成立于2012年,前身是“智能语音实验室”(SpeechLab),经过多年发展,成为了涵盖视听文语言信息处理核心各研究领域的“跨模态语言智能实验室”。目前,跨媒体语言智能实验室的教师组有一位教授、四位副教授和一位科研助理,拥有二十余名博士研究生,近四十名硕士研究生,还包括ACM班、AI班、IEEE班、电院CS等专业、巴黎卓越工程师学院、密西根学院等的三十余名本科生。
实验室获得了包括国家重点研发计划、自然科学基金委优秀青年科学基金在内的诸多国家和企业项目支持。实验室与思必驰科技股份有限公司深度合作,成立了“上海交通大学思必驰智能人机交互联合实验室”。实验室可调动丰富的数据资源以及多达数百块H800、A800、A10等GPU卡的丰富计算资源,是国际上极少数可以进行产业级大尺度数据分析和研究的人工智能实验室之一。
X-LANCE实验室致力于做能够改变世界的国际水平的技术研究,实验室的学术信条:要用技术改变世界,首先必须是一个优秀的工程师;而一个杰出的工程师一定是一位科学家。