优秀校友推介 | 黄铁军:耕耘不辍,开拓人工智能新赛道

文摘   2024-11-12 15:38   河北  



优秀校友推介



黄铁军,1985-1988年就读我校高中151班。现任北京大学计算机学院教授,多媒体信息处理全国重点实验室主任,北京智源人工智能研究院理事长。曾获2017国家技术发明奖二等奖、2012国家科技进步二等奖、2022中国标准创新贡献奖突出贡献奖、2022吴文俊人工智能科学技术奖杰出贡献奖,日内瓦国际发明展评审团嘉许金奖。国家杰青(2014),长江学者(2015),万人计划科技创新领军人才(2018),北京学者(2023),中国人工智能学会、中国计算机学会、中国图象图形学学会和中国电子学会会士。



在北京海淀,有这样一群人,他们以萤萤之光,绘就时代的璀璨星空。他们当中,有的扎根基层,全心全意为人民服务;有的爱岗敬业,在专业领域作出了突出贡献;有的热心公益,用爱心善举传递着人间温暖……他们有一个共同的名字——“感动海淀”文明人物。

4月22日,“感动海淀”2023年度暨第十三届年度人物颁奖典礼在国图音乐厅举行。北京大学计算机学院教授、多媒体信息处理全国重点实验室主任、北京智源人工智能研究院理事长、创始院长黄铁军位列其中。

从ChatGPT到视频生成大模型Sora,“大模型”成为科技行业的一个热门词语。黄铁军研究AI超过30年,擅长智能视觉信息处理技术,终结了国外向我国视频行业索取高额专利费的历史。2020年,在大多数人对大模型还一无所知的时候,他掌舵北京智源研究院智源研发大模型,并在2021年上半年推出了开创“中国首个”“世界最大”的大模型悟道1.0和悟道2.0。黄铁军培养了一批大模型人才,当前大模型创业公司、大厂,从事研发的CTO或首席科学家中,参加过悟道项目的人不在少数,这里被称为大模型的“黄埔军校”。如今,他瞄准打造开源开放的人工智能大模型体系,紧紧抓住创新这个“牛鼻子”,加快关键核心技术攻关,抢占人工智能新赛道。


志存高远



1970年,黄铁军出生在河北省邯郸市大名县的一个普通村庄。1985年,刚刚上高中的他就赶上“电脑要从娃娃抓起”的东风,跟随班主任霍振祥老师学习Basic语言。在学校微机课程中第一次接触到苹果电脑,他很是兴奋,因为进步很快,霍老师把自己大学期间的计算机教材都给他自学,黄铁军对油印教材中的流程图至今记忆犹新。

1988年,黄铁军报考北京大学,数分之差未能如愿,被武汉工业大学(现武汉理工大学)计算机应用专业录取。大学毕业那一年,他后来的硕士导师申请到863计划课题,研究手写体汉字识别,需要新生力量,鉴于他当时成绩优秀,就被免试进入课题组读硕士。1995年他入读华中理工大学(现华中科技大学)模式识别与智能控制专业攻读博士学位,期间研究虚拟现实,主要是基于双目立体视觉的场景建模,如此算来从事计算机视觉已近三十年。

1999年,黄铁军进入中国科学院计算技术研究所进行博士后研究,研究方向为图像识别技术,合作导师是时任所长、现北京大学教授、中国工程院院士高文。本来他以为自己会沿着计算机视觉这条路走下去,但命运却把他引向了岔路口——视频编码。

2002年,数万台我国制造出口的DVD,由于未支付专利许可费,在欧盟地区被海关扣押。在专利大棒的打压下,集中在广东地区的相关生产工厂大量倒闭。

“那是改革开放后,我国首次遭遇重大知识产权问题。”黄铁军说,制定中国自主知识产权音视频压缩标准,摆脱受制于人的困境,在当时变得十分迫切。

博士后刚出站的黄铁军,便协助高文教授组织成立数字音视频编解码技术标准工作组。对他而言,视频编码是个“从未涉足过的领域”。“既然是国家需要,自己接下了任务,就得好好干。”黄铁军说,此后他的研究重心逐渐向视频编码方向倾斜,也开启了视频编码标准突围和超越之路。

2002年至今担任国家数字音视频编解码标准工作组(AVS)秘书长20年,牵头或作为主要起草人制定三代国家标准,编码效率实现了对同期国际标准的赶超。2008年上海东方明珠采用AVS1转播奥运会,2012年中央电视台采用AVS+播出高清电视,之后国内外上千路电视频道采用,2018年中央电视台采纳AVS2进行4K超高清播出,保障2019年国庆70周年直播,2022年中央广播电视总台采用AVS3对北京冬奥会8K播出。担任国际标准化组织MPEG中国代表团团长10年,起草ISO/IEC国际标准4项,获ISO和IEC秘书长联名签发证书。

2007年,黄铁军开始研究监控视频编码,2010年研究视觉特征编码,创立了以特征分析与压缩为中心的视频大数据高效处理技术体系,发明了视觉特征高效压缩、场景视频建模压缩、对象精准分析识别等技术并成为国际标准,实现了识别精度和压缩效率提升,在百度、腾讯、海信产品中被数亿用户使用,2017年获得国家技术发明二等奖。



悟道出世



人工智能是新一轮科技革命和产业变革的重要驱动力量。黄铁军从2016年开始全程参与国家新一代人工智能发展规划的建议、起草和实施。2017年7月国务院印发《新一代人工智能发展规划》,11月“科技创新2030”新一代人工智能重大科技项目启动,黄铁军担任专家组副组长,负责基础软硬件板块,主导建立了覆盖芯片、系统软件、算法框架、开发环境和应用编程接口的全栈技术体系,对我国新一代人工智能技术生态建设作出了突出贡献。

2018年北京市发布支持建设世界一流新型研发机构实施办法,北京智源研究院成立,首任院长便由黄铁军担任,提出自由探索与目标导向相结合的创新机制,实施智源学者计划,紧密团结高校院所和优势企业,探索人工智能前沿。“智源研究院定位为人工智能领域新型研发机构,密切关注人工智能技术发展,基于对未来产业的判断,2020年决定集中主要精力资源做大模型方向。”

2021年3月20日,悟道1.0横空出世。这是我国首个超大规模智能模型系统,取得了多项国际领先的AI技术突破,形成超大规模智能模型训练技术体系,训练出包括中文、多模态、认知、蛋白质预测在内的系列模型,勇闯通用智能发展前沿,构建我国人工智能应用基础设施。在发布会上,黄铁军说“人工智能发展已经从‘大炼模型’转入‘炼大模型’的新阶段”,大模型一代从此登上历史舞台。三个月后,悟道2.0再次惊艳亮相,模型参数规模达到1.75万亿,打破了之前由谷歌预训练模型创造的1.6万亿参数记录,并在多个国际人工智能基准测试榜单的9项任务上取得领先。

“目前,布局大模型已成为世界性趋势。未来,人工智能大模型时代即将到来。”黄铁军说。2023年6月9日,黄铁军在北京智源大会上发布悟道3.0大模型系列,并宣布进入全面开源的新阶段。

“从梦想角度来说,智源期望不同于前两个技术路线,从‘第一性原理’出发。从原子到有机分子、到神经系统、到身体,构建一个完整的智能系统AGI。这是一个大概20年才可能实现的目标,所以智源作为新型研发机构平台,在三个方向都在开展工作。”黄铁军的这段描述也梳理了此次发布的背后逻辑,分别包括大模型方向、具身方向,以及智源自己期望方向的进展。


开源开放



“智源研究院在今年5月正式推出了智源大模型评估体系,并对国内外140余个开源和商业闭源的语言及多模态大模型进行了全方位的能力评估。评估结果显示,在中文语境的条件下,国内头部大模型的能力已接近国际一流水平,但存在能力不均衡的情况。”黄铁军表示,“中国大模型的发展,需要解决算力资源短缺和高质量中文数据语料库短缺和使用难的问题。随着算力和数据问题的解决,中国大模型的发展有望迎来能力的跃升。”

在数据方面,黄铁军指出,目前在开源语料中,中文语料占比不足十分之一,今年6月,智源研究院推出了多行业中英双语数据集IndustryCorpus 1.0和千万级指令微调数据集InfinityInstruct,解决数据量少和质量不高的问题。智源研究院正在牵头与多家单位共同建设北京市人工智能数据运营平台,支持开源开放、积分共享、数算一体三种模式,解决数据使用难的问题。

“今天互联网产生了海量的数据,这些数据被大模型转换成了智能、转换成了智力,智力像电一样会流通,为每个人、千家万户提供服务。”黄铁军说:“2030年之前,我们每个人都会像今天用电、用网一样方便,以很低的成本用智力,这是一个新的时代。”

对于人工智能大模型的未来发展路线,黄铁军认为,未来3年,大模型将扩展到视觉、听觉、具身、行动等通用智能,规模变大,尺寸变小,成为具身智能的“大脑”,普通语言升级为科学语言,人工智能将解决重大科学问题;未来10年,人类全面进入智力时代,就像工业革命解放体力、电力革命解决能源流通,以智力为核心的科技、经济、社会生态构建完成;未来20年,行为主义(强化学习)和类脑智能(彻底连接主义)发挥更大作用。

如今,黄铁军在抓住科技创新的“牛鼻子”,打造新质生产力的路上耕耘不辍。他说:“人工智能是新一轮科技革命的核心力量。作为我国大模型发源地,智源人工智能研究院正在全力训练多模态大模型和机器人大脑,努力实现人工智能认知能力达到国际领先水平,支撑国家智力基础设施建设,绘制中国式现代化的新华章!”



END

来源:中关村杂志

编辑:沐 伟 孙明田

审核:张建磊 王振廷


大名县大名中学
大名中学官方公众微信号
 最新文章