据外媒 The Information 报道,OpenAI 的元老级人物 Alec Radford 即将离职,离职后进行独立研究。作为一个极其低调、很少公开露面的研究员,Alec Radford在2016年本科毕业后就加入了OpenAI,期间主导了CLIP、GPT-1、GPT-2和Wisper的研发,并参与Scaling Law、PPO、GPT-3以及后续GPT-4o等知名工作。让我们回顾一下Alec Radford的科研历程。
欧林工学院:梦开始的地方
Alec Radford在2011-2016年间,本科就读于美国富兰克林欧林工程学院(简称欧林工学院)。可能这个高校在国内并不为大多数人所知,这是一个小而美的精英高校,仅有三百多名学生。欧林工学院的课程设计以项目为导向,强调理论与实践的结合,注重培养学生的创业精神和实践能力。由于其课程难度大,学业项目耗时多,被成为“最卷”高校之一。
Kaggle:初露锋芒
Alec Radford在欧林工学院的本科课程学习期间,数据科学竞赛平台Kaggle也开始逐步流行起来,Alec Radford也参与其中,活跃在2013到2014年间,并获得了Kaggle Master的称号。
https://www.kaggle.com/alecradford
从参与的比赛来看,涉及了传统机器学习、计算机视觉、音频信号处理以及自然语言处理。在那个机器学习算法尚未充分工具化的年代(彼时还没有“调包侠”,AlexNet也才刚刚被提出),短短两年间参与了二十个比赛,涉猎可谓广泛,强度之高也可见一斑。需要注意的是,此时Alec Radford仅仅只是一名低年级本科生,在Kaggle的高强度训练中,实践能力得到了飞速增长。
DC-GAN:一举成名天下知
Ian Goodfellow在2014年提出了对抗式生成网络GAN,但GAN的热潮席卷全球学术界还得靠Alec Radford的工程实践:DC-GAN。原始的GAN使用的是简单的MLP,更多是提出了思想,而没有太多工程上的实践优化,所以效果还不那么惊艳。但是DCGAN使用了当时流行的卷积网络结合GAN,结合Alec Radford强大的工程和调参能力,获得了在当时而言非常惊艳的图像生成效果,帮助生成式网络第一次在学术界爆火(虽然这些效果图对比现在的生成模型而言有点相形见绌)。
DC-GAN的另外两名作者,是Alec的同学Luke Metz和PyTorch之父Soumith Chintala。当时还在上学的Alec已经参与创立了indico.io(现名为Indico Data),Luke也加入到了该公司,后来先后去了Google Brain和OpenAI,最近也从OpenAI离职。
经常训GAN的小伙伴们都知道,GAN的训练非常不稳定,需要很多的技巧,而且生成结果大多数也并不让人满意。Alec Radford因为DCGAN的一举成名,也有机会和GAN的原作者Goodfellow一起发表了论文:ImprovedGAN。这两篇论文发表时,Alec Radford还只是一名高年级本科生,这也为其加入OpenAI进行了铺垫。
OpenAI:天才绽放光芒
时间来到2016年,Alec Radford在欧林工学院毕业。同年加入了OpenAI,主导或参与了一系列知名工作,获得了超过19万的引用量,其中4篇一作工作引用量突破1万。
Alec Radford进入OpenAI后,没有继续从事GAN相关的研究,而是转向NLP领域,并全程参与了GPT系列的研发。Alec是GPT-1 的一作、GPT-2 的共同一作,也参与了GPT-3以及后续GPT-4、GPT-4o等工作。此外还参与了强化学习算法PPO的工作,这也被用在大模型的RLHF阶段中。
下一个风口会不会是生成式AI 与具身智能的时代,我们特意创建了生成式AI与具身智能交流社区,关于大模型,机器人的相关业界动态,学术方向,技术解读等等都会在社区与大家交流,欢迎感兴趣的同学加入我们(备注具身智能)!
自动驾驶之星知识星球主打自动驾驶量产全技术栈学习,并包括: 学习板块,求职面试,有问必答,论文速递,行业动态五大板块!星球内部包括端到端大模型,VLM大模型,BEV 障碍物/车道线/Occ 等的学习资料!
生成式AI与具身智能知识星球,我们相信生成式AI 与具身智能会碰撞出出乎我们意料的内容,本知识形象并包括: 学习板块,求职面试,有问必答,论文速递,行业动态五大板块!星球内部包括生成式AI大模型,具身智能,业界资料整理等的学习资料!
👇点个“赞”和“在看”吧