中國AI新創公司DeepSeek近來迅速走紅,據稱讓加州矽谷緊張。DeepSeek大模型的關鍵開發者之一是在中國被稱為九五後(1995年後出生者)AI天才少女羅福莉。
小米創始人雷軍日前才以人民幣千萬元年薪招攬羅福莉,由她領導小米AI大模型團隊。
綜合中國媒體報導,去年底DeepSeek發布新一代大模型DeepSeek-V3,同時宣布開源(公開原始碼和技術細節)。
今年1月20日,DeepSeek再發布DeepSeek-R1。在多項基準測試中,V3的成績超越主流開源模型,同時由於其極低的訓練成本,該模型也被形容為「AI界拼多多」(喻其物美價廉)。
DeepSeek模型的關鍵開發者之一,羅福莉也迅速走紅。她出生於1995年,畢業於北京師範大學電腦系,擁有北京大學計算語言學碩士學位。2019年在北大讀碩士時,就在人工智慧領域頂尖國際會議ACL發表八篇論文。畢業後第一份工作在阿里達摩院,從事預訓練語言模型相關工作,主導開發多語言預訓練模型VECO。
2022年,羅福莉加入幻方量化公司,從事深度學習相關策略建模與演算法研究;後來轉到DeepSeek擔任深度學習研究員,參與研發MoE大模型DeepSeek-V2。該大模型只有美國GPT4價格的1%,被稱為性價比之王。
外界稱她為AI天才少女,但羅福莉認為自己是電腦領域的「低起點者」。她曾說自己從小城市的高中考到北京師範大學,誤打誤撞進入電腦專業。大學時期還一度考慮轉行做產品。轉折點發生在研究所階段,羅福莉被保送至北京大學計算語言學所後,開始在人工智慧領域展露天賦。
談到暴紅經歷,羅福莉並不希望自己被神化、娛樂化。「突然之間千奇百怪的機會都來了,有找我出書的、有找我錄公開課的,甚至有經紀公司找來的。」
提到「幻方量化」就必須提到DeepSeek創始人梁文鋒,梁文鋒「發跡」於量化投資,是低調的「量化天王」。今年40歲的梁文鋒在2015年與拍檔創辦對沖基金「幻方量化」,迅速在中國崛起,成為第一家籌集超過1000億元人民幣的量化對沖基金。
梁文鋒本科、研究生畢業於浙江大學,擁有信息與電子工程學系本科和碩士學位。2008年起,他開始帶領團隊使用機器學習等技術探索全自動量化交易。2023年7月,DeepSeek正式成立,進軍通用人工智能領域,至今從未對外融資。
©世界生活通
长按下方二维码关注我们
移民法律 健康養生 生活熱點 休閒娛樂 關注世界生活通 一切盡掌握