👇🏻点击下方卡片关注公众号
不再错过每一篇精彩更新
工作日常 / 招聘
本文 1800 字,约需 5 分钟
我是做外卖广告的算法平台的。
什么是“算法平台”呢?每次给朋友介绍的时候,朋友都一头雾水。
相信大家对算法岗位在做什么都比较熟悉了。简单来说,算法岗位的工作就是通过海量的数据训练出机器学习模型,这个模型能完成某一个方面的任务,比如 CTR 预估、AIGC 等等。
算法模型每天都在迭代,如果每个同学都各干各的,各种工具和代码不能复用,那么效率一定会奇差无比。
我们组在干的事情,就是打造一个完整的算法工作平台,能完成数据准备、模型训练、模型部署。
这样就可以使算法同学专注于特征和模型的效果上,不用关心工程上的性能优化,就可以提高算法同学的工作效率,节约了大团队的成本。
有算法平台后,专注算法本身,井井有条😄
具体来说,我们的工作主要是下面 3 个事情。
特征平台。特征是模型的输入,非常重要。特征包括离线、在线:离线是为了将特征快速生产出来给模型训练使用,因此关注高吞吐;在线是给线上模型预估使用的,因此关注低时延。特征是五花八门的:有静态的,有动态的;有单值的,有序列的;有数值的,有文本的……总之,一个平台要兼容各种需求,还要保障线上线下的一致性,很有挑战。这方面用到的技术有 Spark、Flink、Hive、HBase 等等。团队技术文章:https://tech.meituan.com/2021/03/04/featureplatform-in-mtwaimai.html
模型部署。算法同学生产出来模型以后,要部署上线。大家都知道深度学习模型的参数越来越多,计算量也越来越大,现在普遍使用 GPU 加速推理。业界普遍使用 TensorRT、TVM 这些应用来加速推理,除此之外一个模型还是需要很多优化,才能实现高效地在 GPU 上推理。这方面的技术比较前沿,我们团队也做得相当不错。团队技术文章:https://tech.meituan.com/2022/07/06/largescaledeeplearningmodel-engineeringpractice-in-mtwaimaiad.html
机器学习 Pipeline。算法团队有很多人,我们组当然不可能一对一的、case by case 去做这些事情。因此我们做了工作台,让算法同学可以通过配置就能完成特征、模型的全生命管理。绝大多数算法同学的模型迭代我们都是无需感知的,这需要很强的业务和算法抽象能力。这方面主要运用的技术主要是 MLOps。
我们团队一直在随着算法模型的演进而追随业界最先进的技术,比如最近的 AIGC 我们也在探索。
另外,我们面向的客户是公司内的算法同事,不用跟产品同学打交道。团队离业务比较远,更偏技术一些。喜欢钻研技术的同学,可以优先考虑下我们。
上述 3 个方向都在招人,如果你有兴趣,可以直接扫描文末我的微信二维码和我沟通。
下面是岗位的具体要求。
简历投递方式:我的微信二维码,欢迎投递简历,欢迎交流行业经验👇🏻
都看到这里了,关注一下公众号吧~~
关注后回复 1,领取 LeetCode 算法刷题路线;回复 2,领取我写的 1000 篇算法题解 ↓
我是「负雪明烛」。我用 7 年,写了 1000 多篇题解,博客累计阅读量 400 万+。
关注我,你可以获得优质算法题解、求职技巧、大厂内推、工作经验。
欢迎点击关注+星标⭐️!