Talk预告 | 中科院自动化研究所尼博琳:拓展语言-图像模型用于视频识别

发布于:2022-12-28 ⋅ 阅读:(575) ⋅ 点赞:(0)

本期为TechBeat人工智能社区437线上Talk。

北京时间9月7(周三)20:00中科院自动化研究所在读博士生——尼博琳的Talk将准时在TechBeat人工智能社区开播!

他与大家分享的主题是: “拓展语言-图像模型用于视频识别”,届时将介绍如何将语言-图像模型拓展到视频识别领域,打造一个更加通用的视频识别框架。

 

Talk·信息

主题:拓展语言-图像模型用于视频识别

嘉宾:中科院自动化研究所在读博士生 尼博琳

时间:北京时间 9月7日 (周三) 20:00

地点:TechBeat人工智能社区

http://www.techbeat.net/

点击下方链接,即可观看视频 

TechBeatTechBeat是荟聚全球华人AI精英的成长社区,每周上新来自顶尖大厂、明星创业公司、国际顶级高校相关专业在读博士的最新研究工作。我们希望为AI人才打造更专业的服务和体验,加速并陪伴其成长。https://www.techbeat.net/talk-info?id=710

Talk·介绍

近年来,语言-图像预训练模型表现出强大泛化和迁移能力。在本工作中,我们探索如何将语言-图像模型拓展到视频识别领域,打造一个更加通用的视频识别框架。我们提出的方法在不同的数据条件下均取得了优异的性能。

具体分享提纲如下:

1. 背景和动机

  • 视频识别

  • 语言-图像预训练

2. 方法

  • 拓展语言-图像模型用于视频识别的框架

  • 跨帧交流编码器

  • 视频内容自适应的文本提示学习

3. 实验结果

 

Talk·预习资料

  1. CIP:https://arxiv.org/abs/2103.00020

  2. Florence:https://arxiv.org/abs/2111.11432

  3. ALIGN:https://arxiv.org/abs/2102.05918

Talk·提问交流

通过以下两种方式提问都将获得微信现金红包奖励哦!

方式 ①

在Talk界面下的【交流区】参与互动!留下你的打call🤟和问题🙋,和更多小伙伴们共同讨论,被讲者直接翻牌解答!

你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!

方式 ②

在本文留言区直接提出你的问题!

Talk·嘉宾介绍

尼博琳

中科院自动化研究所在读博士生

目前就读于中科院自动化研究所,现在是一年级博士生。主要研究领域为视频内容理解,网络结构的设计和搜索,多模态模型等,研究成果在ECCV等会议发表。

个人主页:

https://github.com/nbl97

 

-The End-

关于TechBeat人工智能社区

TechBeat(TechBeat)隶属于将门创投,是一个荟聚全球华人AI精英的成长社区。

我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。

期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!

更多详细介绍>>TechBeat,一个荟聚全球华人AI精英的学习成长社区

本文含有隐藏内容,请 开通VIP 后查看