报告内容简介: 近来多模态大模型技术发展迅速,大大提升了跨媒体理解和生成能力,因其能够学习到更富的语义和视觉表示,或将改变传统媒体的表示、编码与传输方式,未来融合信号、特征和语义的智能编码/生成编码是突破编码效率提升瓶颈的重要方向。本报告主要介绍团队近期在图像视频生成编码方面的一些探索,以及未来发展所面临的挑战。
报告人简介: 马思伟,北京大学博雅特聘教授,IEEE Fellow,国家杰出青年基金获得者。主要研究方向视频处理与编码。曾担任IEEE Transactions on Image Processing(TIP),IEEE Transactions on Circuits and System for Video Technology (TCSVT) , Journal of Visual Communication and Representation (JVCIR)期刊编委,IEEE VCIP2017 程序委员会联合主席。曾获国家技术发明奖一等奖、国家技术发明奖二等奖、国家科学技术进步奖二等奖等奖励。 |