专题征稿 | 生成式媒体处理、计算和评估

学术   2024-09-16 12:01   北京  


将我们设置为星标账号不错过最新学术资讯!



专题介绍



生成式媒体处理、计算和评估

Generative Media Processing, Computing, and Evaluation


在人工智能生成内容的新时代,特别是扩散模型、大模型的兴起,使生成式媒体成为人们关注的焦点。生成式媒体处理、计算和评估利用了新兴的生成式人工智能,创建和处理多媒体、计算理解内容、全面评估领域挑战。研究人员也正在通过多模态和跨模态来寻求生成式媒体的进一步发展,如以文本模态作为生成视频的提示。本专题旨在探索生成式媒体的最新进展和突破,这些相关前沿技术、理论方法、应用实践正是塑造生成媒体未来的关键。


我们欢迎高质量的原创研究论文,主题包括但不限于:

  • 用于媒体生成、采集、压缩和处理的生成模型,例如VAE、GAN、Transformer、NeRF、Gaussian Splatting、扩散模型、LLM等;

  • 经典多媒体信号处理技术在生成式媒体中的新应用,例如傅里叶变换和小波变换等,用于增强生成模型的可解释性;

  • 新颖视觉计算和处理技术,例如可降低复杂度和提高质量的检测、跟踪、复原和理解等技术;

  • 视觉数据与其他模态(如音频、文本)的集成与合成;

  • 增强视觉计算和理解的多模态和跨模态技术,例如大视觉/语言模型(ViT、Clip、Llama、GPT4、Flan-T5等)、SAM等,以及HOI等应用;

  • 使用生成模型进行域适应和迁移学习,以提高资源效率;

  • 使用合成和真实媒体数据进行模型评估、基准测试和分析。


关键词:

生成式人工智能,生成式媒体,大语言模型,多模态大模型,扩散模型


专题截稿日期:

2025年1月1日

扫码了解专题详情


请您投稿时在系统选择文章类型为“VSI: Generative Media



客座编辑


吴科君 博士

华中科技大学


吴科君博士(IEEE高级会员),华中科技大学电子信息与通信学院讲师,中国科协决策咨询专家团队青年研究员,2022年至2024年在南洋理工大学电气与电子工程学院从事博士后研究工作。近年来主要从事视觉信息处理及人工智能的交叉研究,在生成式人工智能、智能媒体、多模态大模型等领域发表国际期刊会议论文40余篇,授权发明专利及提交MPEG国际标准提案多项;担任IEEE ICASSP 2024、IEEE ISCAS 2024、IEEE MMSP 2023等国际会议专题主席,JVCI期刊客座编辑等。



Lijuan Wang 博士

美国微软雷德蒙德研究院

Lijuan Wang博士(IEEE高级会员)担任首席研究员和研究经理,领导微软GenAI的多模态生成AI研究小组。她在清华大学获得博士学位后,于2006年开始在微软亚洲研究院任职,于2016年加入微软雷德蒙德研究院。她发表了100多篇顶级论文,拥有20多项美国专利。她的研究涵盖了从3D对话到视觉语言预训练、视觉基础模型和图像/视频生成的广泛领域。作为视觉语言预训练、图像字幕和对象检测的关键贡献者,她的研究对微软产品,如Cognitive Services和Office 365的开发至关重要。



杨铀 博士

华中科技大学

杨铀博士(IEEE高级会员),2009年博士毕业于中国科学院计算技术研究所,2011年于清华大学博士后出站,2011年于北京数码视讯战略研究院任首席科学家,2013年起在华中科技大学开展工作,他是IET Fellow、IEEE/SPIE 高级会员。主要从事计算机视觉、计算光场科学研究及其在灾害态势感知、交互式媒体系统等方面的应用研究工作。在国内外重要的期刊、会议上发表学术论文130篇,获中美发明专利授权41项,国际PCT专利7项。担任国际期刊Optics Continuum、Journal of Electronic Imaging、IET Image Processing等期刊副主编。



 Xinchao Wang 博士

新加坡国立大学

Xinchao Wang博士(IEEE高级会员),新加坡国立大学电气与计算机工程系助理教授,曾在史蒂文斯理工学院担任计算机科学终身助理教授。获洛桑联邦理工学院博士学位,香港理工大学一级荣誉学位。研究兴趣包括人工智能、计算机视觉、机器学习、医学图像分析和多媒体。他的文章发表在CVPR、ICCV、ECCV、NeurIPS、AAAI、IJCAI、MICCAI、TPAMI、IJCV、TIP、TKDE、TMI和TNNLS。他是IEEE Transactions on Image Processing, Pattern Recognition, IEEE Transactions on Circuits and Systems for Video Technology,Journal of Visual Communication and Image Representation等期刊的副主编,担任CVPR、ICCV、NeurIPS、ICIP、ICME的领域主席。



俞刚 博士

阶跃星辰

俞刚博士,担任StepFun(阶跃星辰)的首席研究科学家,加入StepFun之前,曾在腾讯担任研究总监四年,在旷视科技(Face++)担任研究总监五年。2014年于南洋理工大学获得博士学位。研究兴趣集中在计算机视觉、人工智能等领域,特别是生成人工智能、对象检测、分割、人类动作识别和3D重建。他曾担任Journal of Visual Communication and Image Representation副主编,CVPR2024领域主席,IEEE Transaction on Pattern Recognition and Machine Intelligence, International Journal of Computer Vision, IEEE Transactions on Image Processing, IEEE Transactions on Circuits and Systems for Video Technology, CVPR, ICCV, ECCV审稿人等。



袁浚菘 博士

纽约州立大学布法罗分校

袁浚菘博士(IEEE   Fellow)是美国纽约州立大学布法罗分校计算机科学与工程系教授兼视觉计算实验室主任,在加入纽约州立大学布法罗分校之前,他曾在新加坡南洋理工大学担任副教授(2015-2018)和南洋助理教授(2009-2015),他于2009年获得美国西北大学博士学位。他获得了纽约州立大学Chancellor's Award for Excellence in Scholarship and Creative Activities奖、西北大学杰出EECS博士论文奖和IEEE Transactions on Multimedia最佳论文奖。他担任Journal of Visual Communication and Image Representation高级领域主编,IEEE Trans. on Pattern   Analysis and Machine Intelligence, IEEE Transactions on Image Processing,   IEEE Transactions on Circuits and Systems for Video Technology副主编,他还担任ICME主席以及CVPR、ICCV、ECCV、ACM MM等的领域主席。


客座编辑寄语:

本专题将重点关注生成式媒体处理、计算和评估领域的突破和创新,汇集研究人员和行业专家,讨论正在塑未来生成式媒体的前沿技术、方法、应用和理论发展,以加快传统多媒体信号处理与新兴生成模型之间的融合,促进跨学科合作和知识共享。    


关于期刊


Journal of Visual Communication and Image Representation 期刊发表与视觉传达与图像表征前沿研究相关的论文,重点关注这一多学科领域中的基础研究和新技术和理论应用。视觉通信和图像表征领域范围广泛,包括数字和模拟方面以及生物视觉系统中的处理和通信等。


本刊研究领域包括:

  • 图像分析与合成

  • 数学形态学

  • 计算机视觉

  • 图像理解和场景分析

  • 视频理解

  • RGB-D 和 3D 处理

  • 视觉信号处理的深度学习

  • 确定性和随机图像建模

  • 视觉数据缩减和压缩

  • 图像编码与视频通信

  • 用于视觉通信的虚拟现实和增强现实技术

  • 图像和视频隐私增强技术

  • 图像和视频的数据隐藏、感知散列、指纹识别

  • 图像和视频取证与反取证

  • 生物和医学成像

  • 生物视觉系统的早期处理

  • 视觉感知的心理物理分析

  • 遥感


扫码了解专题详情

期刊推荐


Online ISSN:1095-9076


CiteScore:5.4

Impact Factor:2.6


扫码了解专题详情



爱思唯尔是全球领先的信息分析公司,帮助科学家和临床医生发现新的答案、重塑人类知识并应对最急迫的人类危机。140年来,我们携手全球科研界,管理和验证科学知识。并将这种严谨标准延续到了我们今日新一代的信息平台。爱思唯尔在战略研究管理、研发表现、临床决策支持和专业教育领域提供数字化解决方案和工具,包括ScienceDirectScopusSciValClinicalKey Sherpath。爱思唯尔出版超过2700部数字化期刊,如The Lancet《柳叶刀》和Cell《细胞》, 42000多种电子书籍以及诸多经典参考书,如Gray’s Anatomy《格氏解剖学》。爱思唯尔是励讯集团(RELX)的成员之一,励讯集团为全球专业人士和商业客户提供科学、医疗、法律和商业领域信息分析服务及解决方案。更多信息,欢迎访问爱思唯尔中文官方网站:www.elsevier.com


点击阅读原文

了解专题详情


动动手指点个“

让我知道你在看

爱思唯尔Elsevier
引领科学,技术,医疗的创新发展之路
 最新文章