注意,这不是“爽文”情节,而是现实发生的事。在近日举行的昇腾AI开发者创享日·天津站活动中,来自南开大学研二的陈铎晟同学作为昇腾AI优秀开发者代表,分享他的昇腾AI学习之路,揭开了AI开发的神奇魅力。
活动间隙,《极客网》对话陈铎晟,聊了聊如何从一名AI小白成长为昇腾AI优秀开发者,并将AI模型装进港口实际应用场景的经历,特分享给有志于AI事业的年轻开发者。
实验室结缘,筑牢基础知识
本科就读于西安电子科技大学软件工程专业的陈铎晟,此前并没有系统学习人工智能相关知识。研究生保送至南开大学计算机学院后,本着对AI的浓厚兴趣,他加入了南开大学计算机视觉实验室,参与到校企合作的项目中,推开了AI探索的大门。
作为AI领域的小白,初入实验室的陈铎晟先是集中学习了人工智能原理、深度学习以及昇腾AI等领域的基础知识。借助昇腾社区提供的完善的学习文档及官方教程,以及与华为工程师的频繁交流沟通,他为日后的AI探索打下了坚实的理论基础。
接着,陈铎晟参与到AI框架昇思MindSpore的CANN算子开发项目中,开始上手完成算法复现与转换。他与实验室同学们一起,基于MindSpore框架对业界经典的ReID、PoseTrans等算法进行重构,获得官方认证后发布到昇腾社区,在动手实操中积累了一定的开发经验。
从实践中来,提升关键能力
在所有的目标识别应用中,车辆识别是AI在交通管理和安全领域的一个重要应用类别。而在港口、矿山等特殊场景下,车辆识别受环境因素的影响很大,对识别准确性和系统稳定性的要求更高。陈铎晟迎难而上,借助校企项目合作机会,基于真实场景需求,与团队一起钻研智慧港口的车辆识别应用。
在算法层面,针对极高视角导致的车牌形状畸变、较远距离造成的车牌位置极小、恶劣环境带来的车牌污渍严重等制约港口车辆识别精度的几大难点,陈铎晟与团队在昇腾AI基础软硬件上训练Yolov5和CRNN开源模型,以更好地采集车牌边界信息和识别车牌内容,并不断优化代码提高检测识别精度。
在数据层面,由于港口数据封闭导致目前几乎不存在可供训练的车牌识别数据集,他们专门采集原始港口监控数据,手工剔除噪声样本,并引入大规模公开数据集,自行标注制作可用于港口车辆检测的覆盖全天候(大雨、大雪、夜间、强光照等)的数据集,以更好地支持模型训练。
在部署层面,陈铎晟根据此前开发学习的案例,独立编写适用于昇腾硬件的推理代码,确保模型在端侧正常训练和推理,实现端侧设备的模型转化并成功运行。
经过一这系列的实践探索,陈铎晟完成了其AI探索道路上第一个完整的项目,提升了在AI模型开发训推全流程的关键能力。
特别是在AI技术落地应用最后也是最关键一步的部署方面,为了确保训练得到的模型能在具体生产环境中正确、高效地实现推理功能,要求的条件往往非常繁琐而苛刻,具体性能表现的变数也比较大,对AI开发者极具考验。
对此陈铎晟坦言,团队在港口车辆识别项目的部署上也遇到了很多难题,包括算子/算法的匹配,计算资源的满足等,需要对应的适配支持。所幸经过紧密的沟通配合,在昇腾社区和华为工程师的帮助下,这些问题都得到了很好的解决。
到实践中去,解决行业痛点
为此在有了一定的项目积淀之后,他决定到实践中去,不断创新做出更好的AI应用。在华为举办的2023昇腾AI创新大赛中,他带领团队基于昇腾AI全栈基础软硬件技术,继续攻克车辆识别领域的算法关键性难题,交出了一种针对车辆识别的新的解决方案。
9月,这项名为“基于极高视角的港口磅房综合车辆识别系统”的方案在2023华为昇腾AI创新大赛天津赛区应用赛道比赛中过关斩将,一举揽下银奖。该方案将创新设计的算法与能够激发强大算力的MindSpore框架相结合,进一步实现了模型性能的优化。
磅房作为港口货物出入管控的节点,是港口生产中的重要环节,其吞吐量将直接影响港口的生产效率。陈铎晟团队的新方案支持125路高并发访问,目前已在港口中实际部署使用,车辆检测识别准确率达到99%以上,大幅提升了磅房的过磅效率。
值得一提的是,在这之前,业内同类方案的识别准确率只有95%左右。从95%到99%以上的提升,对于AI方案在工业界的落地来说,别提有多么重要!
写在最后:
刚刚过去的2023年,生成式AI及其背后大模型的横空出世,给肩负“定义世界”的软件产业带来了颠覆式创新的可能。未来属于AI,更属于懂AI的人,一时间AI原生应用、AI工程师等成为最津津乐道的话题,牵动着每一个开发者的神经。
陈铎晟从软件工程投身AI开发,并迅速从小白成长为昇腾AI优秀开发者,相信正是新生代开发者拥抱AI的真实写照。在昇腾AI全栈基础软硬件技术与昇腾社区完善成长机制的赋能下,相信会有更多年轻的AI开发者加入进来,成为智能世界的决定性力量!