VALSE2022天津线下参会个人总结8月22日-1
写在前面
非常幸运也很感谢VALSE给了我这样一个能线下参加的机会,遇到了很多的业界大佬,特别是深度学习领域一些大牛导师和一些代表作的一作们,他们的演讲给予我很多启发与见识,与大牛导师/作者的面对面交流更是让我激动不已。
会议持续3天(8月22-24日),5个报告,12个APR报告,18场Workshop,200篇左右的顶会顶刊Poster。
每篇博文的内容太多消化不了,请移步以下链接分别浏览:
PS:没关注的同学点点关注[厚着脸皮球球了],主页更多内容,持续输出干货,有问题私信或者留言都可,笔者看到后会第一时间回复,助力大家科研。
8月22日会议安排
第一天是没有Workshop的,所以大家几乎都是同时看的一场报告。
特邀报告一:卢老师带来的一网通吃:跟踪与分割大一统
卢老师的报告主要围绕着视频领域单/多目标跟踪/分割讲解,具体的可以搜索下卢老师相关文章,下面是一些现场的PPT照片,
特邀报告二:张磊老师的报告:深度神经网络优化技术探索
张磊老师的报告言简意赅,很容易理解,实属我最喜欢的老师之一了,分别从模型的特征优化,权重优化,优化器优化三个方面讲解的优化内容,没有复杂的公式讲解,就是一些基础原理很直白,理解起来没啥难度。
企业宣讲环节
图森未来讲的时候没赶上,去趟卫生间了,报告不安排休息时间。后面听了华为的报告,不得不说,PPT做的牛XX。
特邀报告3:张老师带来的深度学习探索
报告很精彩,干货满满,我是大部分没听懂啊😅
年度进展评述:Vision Transformer
这些PPT的照片是有关于我的方向(多模态)认为比较重要的东西,好比综述。
年度进展评述:文档智能
年度进展评述:视觉-语言理解与生成
这一部分与我的研究方向契合,所以PPT得拍足了[龇牙]
这里过了一下,所以第一张的近期工作汇总没拍上,可以去找下老师的文章来读。
相信不用我多说,大家也能得到这些工作的启发了。
北京大学多媒体信息处理研究室,招生!!!
下午的报告没听多少,主要是太多公式看不懂啊,但确实都太强了 ┭┮﹏┭┮
特邀报告4:多视图三维重建,基于表示学习的方法
Poster环节
161篇Poster,链接在这:VALSE2022-Poster
我重点关注的是VQA,发现一篇VQA数据集的工作,视频VQA,推广下
Env-QA: A Video Question Answering Benchmark for Comprehensive Understanding of Dynamic Environments
一篇很有意思的工作,双端模型中的不平衡问题,从数据集转向模型
Balanced Multimodal Learning via On-the-fly Gradient Modulation
当时来得早,很多讲者还没过来,所以只看Poster的话,在没有看过论文的前提下,实在看不出啥。
感受下现成的火热吧,这还是没到正点,人更多。
写在后面
这篇博文的内容有点多了,遂开了3篇博文分别总结这三天我听过的报告,请移步以下链接: