由中国人工智能学会(CAAI)主办,CAAI 人工智能基础专委会、河北工业大学、天津大学共同承办的CFAI走进高校@天津报告会将于2024年12月28日在河北工业大学举办。会议聚焦国家重大战略发展需求和人工智能领域关键问题,探讨京津冀地区新兴产业、特色优势产业与优质服务的数字化与智能化需求,推动京津冀地区的科技创新与协同发展。会议邀请北京大学林宙辰教授、北京航空航天大学童咏昕教授、中国科学院计算技术研究所冯洋教授、浙江大学巫英才教授、南方科技大学唐珂教授、北京航空航天大学张宝昌教授对人工智能领域的学术前沿进行深入交流。
主办单位:中国人工智能学会
承办单位:CAAI 人工智能基础专委会、河北工业大学、天津大学
会议时间:2024年12月28日(周六)
会议地点:河北工业大学 北辰校区 三教报告厅
报告会日程✦
专家简介✦
林宙辰
北京大学智能学院副院长
博雅特聘教授
国家杰青获得者
IAPR/IEEE/CSIG/AAIA Fellow
报告题目:具有万能逼近性质的深度神经网络设计:一阶优化方法
报告摘要:万能逼近能力是深度神经网络成功的基石。然而,几乎所有现有的深度神经网络设计方法都忽略了万能逼近的性质。我们提出了一个统一的框架,基于一阶优化算法来设计具有万能逼近能力保证的深度神经网络架构,其中前向传播被解读为优化算法的更新步骤,(显式或隐式)网络是通过用类似于两层网络或其变形的可学习模块替换算法中的每个梯度项来设计的。我们得到的是深度神经网络都是宽度有界的,即其宽度不会随着逼近精度的提高而增加,因此贴近当前常见的实际场景。此外,在网络中添加归一化、下采样和上采样等操作不会损害万能逼近能力。据我们所知,这是第一个以原则的方式设计具有万能逼近保证的宽度有界网络的工作。我们的框架可以启发各种神经网络架构,包括著名的ResNet和DenseNet等,以及更多新颖的架构。实验结果验证了我们的框架的有效性。
个人简介:研究领域为机器学习和计算机视觉。在人工智能核心期刊和会议上发表论文340余篇,出版中英文专著5本,谷歌引用数为36,000余次。曾多次担任多个业内顶级会议的领域主席和资深领域主席。曾获2023年度吴文俊自然科学一等奖和2020年度CCF科学技术奖自然科学一等奖(均排名第一)。担任中国图象图形学学会(CSIG)机器视觉专委会主任,中国自动化学会模式识别与机器智能专委会副主任,科技部科技创新2030-“新一代人工智能”重大项目负责人。
童咏昕
北京航空航天大学计算机学院教授
国家杰青/优青获得者
报告题目:互联网群体行为驱动的共享资源动态分配
报告摘要:如何将线下服务资源有效地分配给线上大规模用户是提升互联网经济效率的核心计算问题之一,已成为众多互联网经济服务的共性基础。其本质是有限资源供给与海量用户需求间矛盾形成的复杂问题。传统方法受限于资源静态分配假设,导致分配低效、固化,无法解决互联网环境中群体规律难以发现、资源供需失衡和资源分配固化的挑战。本报告首先回顾共享资源动态分配研究的背景,随后介绍互联网群体行为驱动的资源分配框架。最后结合产业应用,剖析上述分配框架在智慧交通与智慧物流等服务中的落地实践。
个人简介:2014年于香港科技大学获计算机科学与工程学博士学位,2015年入选北京航空航天大学“卓越百人计划”。主要研究方向包括:联邦学习、时空大数据挖掘、群体智能与数据库系统等。近年先后主持国家自然基金重点项目、国家重点研发计划课题等科研项目。共发表学术论文百余篇,谷歌学术引用1.3万余次。曾获中国电子学会自然科学一等奖(排名1)、首届阿里巴巴达摩院“青橙奖”和多个国际一流学术会议/竞赛的最佳论文与冠军等奖励;担任中国科技期刊卓越行动计划领军期刊《Frontiers of Computer Science》的执行编委、大数据领域国际顶级期刊《IEEE TKDE》与《PVLDB》的编委、大数据领域重要国际会议DASFAA 2024会议的程序委员会主席(PC Chair);也是CCF杰出会员和杰出讲者、CCF会员与分部工委副主任、CCF走进高校工作组组长。
冯洋
中国科学院院计算技术研究所研究员
“新百星人才计划”入选者
报告题目:即时交互多模态大模型探索
报告摘要:大模型作为现在人工智能领域的主流范式,最初基于文本语料训练得到,由于人们获取信息的多样化,又融合了语音和视觉模态,然而文本仍然是大模型知识的主要来源,其他模态通常与文本模态进行对齐来共享知识。人类有借助于语音和视觉模态与大语言模型进行即时交互的需求,因此需要大模型能够处理流式输入并进行即时响应,发展出了即时交互多模态大模型。而即时交互多模态大模型需要解决以下挑战:首先,要针对用户指令进行快速响应,要求推理速度足够快;其次,针对流式输入,需要判断进行响应的合适时机;再次,需要将其他模态与文本模态对齐,进行跨模态理解和生成;最后,视觉模态信息处理资源消耗大,如何对其压缩保证能够读取更长历史,直接决定视觉模态交互的性能。本报告将围绕即时交互多模态大模型,介绍我们针对以上解码加速、流式输入、多模态对齐以及视觉压缩方面的探索。
个人简介:长期从事自然语言处理方向的研究,在本领域重要期刊和会议发表论文100多篇。担任ARR Permanent Senior Action Editor、Artificial Intelligence等期刊编委以及ACL/EMNLP等国际会议(高级)领域主席,候任ACL Secretary,曾任中国中文信息学会青年工作委员会副主任。主导研发了百聆大模型和LLaMA-Omni即时交互语音大模型,先后获得ACL 2019唯一最佳论文奖、中国人工智能学会“杰出会员”、CCF自然言处理专委会 “青年新锐奖”、 中文信息学会“钱伟长中文信息处理科学技术奖-汉王青年创新奖”一等奖等。
巫英才
浙江大学求是特聘/长聘教授
计算机科学与技术学院副院长
计算机辅助设计与图形系统全国重点实验室副主任
教育部长江学者
报告题目: 面向竞技体育的人工智能技术与应用
报告摘要: 在“更高、更快、更强”的奥林匹克精神引领下,人类在各个竞技体育项目中不断地挑战与突破自身的极限,给人工智能技术带来了广泛的应用场景和巨大的技术挑战。世界各国均高度重视竞技体育人工智能技术的发展,并取得了许多重要的技术突破,形成了世人瞩目的示范应用。本报告将介绍人工智能在足球、乒乓球等竞技体育项目上的研究与应用的最新进展,随后介绍中国乒乓球队的视频智能处理与可视分析等多个案例,最后总结和展望竞技体育人工智能的研究和发展趋势。
个人简介: 致力于AI数据分析、可视分析和人机交互研究,聚焦体育人工智能和网络空间安全等应用,任国家重点研发计划“工业软件”重点研发专项指南组专家、“科技兴体”重点研发专项专家组成员等。牵头主持国家重点研发计划重点专项2项,国家基金委重点项目2项,获浙江省自然科学奖一等奖和科技进步奖一等奖各1项,发表IEEE VIS、ACM CHI、ACM KDD等CCF A类论文80多篇。
唐珂
南方科技大学计算机科学与工程系教授、系主任
教育部长江学者
IEEE Fellow
报告题目:Learn to Optimize
报告摘要:过去几十年,优化算法已在很多领域取得了巨大成功。但绝大部分耳熟能详的优化算法在某种程度上都可视为专用算法。其设计与应用都高度依赖算法和领域专家。随着更多、更多样化的复杂优化问题不断涌现,这种“手工作坊”式的算法设计范式正面临越来越大的挑战。本报告将主要探讨如何以机器学习的手段自动构建优化算法,实现以“算力”换“智力”。
个人简介:主要研究领域为演化计算与机器学习。已发表论文200余篇,近年来主要关注通用黑盒优化方法、优化算法自动设计、机器学习自动化等方面的研究。
张宝昌
北京航空航天大学教授
报告题目:深度神经网络低比特量化技术
报告摘要:深度学习在解决实际问题中获得成功应用,但是其模型参数量大、功耗大,存在端侧设备上的部署应用难等瓶颈问题。为了解决相关问题,提出一系列二值卷积网络构建方法,构建了基于调制网络结构的二值网络模型,引入贝叶斯学习、协同梯度下降算法等方法,实现二值网络模型在目标检测任务上的无损压缩。Transformer是人工智能领域的里程碑方法,为了解决其在实际端侧部署难题,提出Q-VIT、Q-DETR以及在底层视觉任务上的量化方案,实现4-比特目标检测与识别任务上的无损压缩。在应用方面,搭建了智能相机实现了矿山、工业检测等领域应用。
个人简介:主要从事机器学习、计算机视觉、低功耗目标识别等研究,发表录用IEEE汇刊、CCF A期刊和会议等论文近300篇,2篇入选热点论文和5篇入选高引论文,一作单篇论文谷歌引用1296次。连续4年入选爱思唯尔(Elsevier)中国高被引学者,教育部新世纪优秀人才项目、深圳市海外高层次人才计划团队项目、江西省千人计划项目、百度深度学习实验室学术顾问、中关村国家实验室核心双聘人员、美国布法罗大学兼职教授,获得一级学会/省级自然科学奖4项(3项一等奖)和国际重要比赛第一名3项(ECCV和ICPR)。
联系方式✦
负责人:杨 亮 13752497682(微信同号)
金 弟 15822541480 (微信同号)
何东晓 18322306957(微信同号)
联系人:张 帆 13752266606 (微信:ZFlaomao)