本期为TechBeat人工智能社区第437期线上Talk。
北京时间9月7日(周三)20:00,中科院自动化研究所在读博士生——尼博琳的Talk将准时在TechBeat人工智能社区开播!
他与大家分享的主题是: “拓展语言-图像模型用于视频识别”,届时将介绍如何将语言-图像模型拓展到视频识别领域,打造一个更加通用的视频识别框架。
Talk·信息
▼
主题:拓展语言-图像模型用于视频识别
嘉宾:中科院自动化研究所在读博士生 尼博琳
时间:北京时间 9月7日 (周三) 20:00
地点:TechBeat人工智能社区
http://www.techbeat.net/
点击下方链接,即可观看视频
Talk·介绍
▼
近年来,语言-图像预训练模型表现出强大泛化和迁移能力。在本工作中,我们探索如何将语言-图像模型拓展到视频识别领域,打造一个更加通用的视频识别框架。我们提出的方法在不同的数据条件下均取得了优异的性能。
具体分享提纲如下:
1. 背景和动机
视频识别
语言-图像预训练
2. 方法
拓展语言-图像模型用于视频识别的框架
跨帧交流编码器
视频内容自适应的文本提示学习
3. 实验结果
Talk·预习资料
▼
CIP:https://arxiv.org/abs/2103.00020
Florence:https://arxiv.org/abs/2111.11432
ALIGN:https://arxiv.org/abs/2102.05918
Talk·提问交流
▼
通过以下两种方式提问都将获得微信现金红包奖励哦!
方式 ①
在Talk界面下的【交流区】参与互动!留下你的打call🤟和问题🙋,和更多小伙伴们共同讨论,被讲者直接翻牌解答!
你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!
方式 ②
在本文留言区直接提出你的问题!
Talk·嘉宾介绍
▼
尼博琳
中科院自动化研究所在读博士生
目前就读于中科院自动化研究所,现在是一年级博士生。主要研究领域为视频内容理解,网络结构的设计和搜索,多模态模型等,研究成果在ECCV等会议发表。
个人主页:
https://github.com/nbl97
-The End-
关于TechBeat人工智能社区
▼
TechBeat(TechBeat)隶属于将门创投,是一个荟聚全球华人AI精英的成长社区。
我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。
期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!
更多详细介绍>>TechBeat,一个荟聚全球华人AI精英的学习成长社区