中國科技初創公司DeepSeek(深度求索)爆火全球,顛覆美國在AI領域的主導地位,亦令人驚艷中國科技人才的巨大潛力。美國前國防計劃助理部長、哈佛大學教授艾里森近日在X平臺透露,DeepSeek關鍵工程師潘梓正曾經任職英偉達(Nvidia)實習生,慨嘆美國最終無辦法把他留下來。而英偉達的高級研究員亦透露了當年潘梓正選擇離曞美國而回中國加入 DeepSeek團隊的過程。
▲DeepSeek關鍵工程師潘梓正曾經任職Nvidia實習生。
潘梓正2023年當英偉達實習生 獲邀加盟當全職員工卻推辭
艾里森在他的文章中直呼:“是誰錯失了DeepSeek?”他認為, DeepSeek本來有機會在美國誕生,因為DeepSeek爆紅R1模型的關鍵人物潘梓正本來就是輝達的實習生,他2023年夏季在英偉達加州圣塔克拉拉的辦公室工作了四個月,同時在澳洲蒙納殊大學(Monash University)攻讀博士,最后獲得英偉達賞識,送上一份全職合約。
然而, 最終潘梓正決定離開美國,回到中國,并加入了DeepSeek成為這間初創公司的第四名工程師,亦因為如此造就了中國一次科技界突破,導致美國在AI領域主導地位動搖,相關公司市值蒸發1兆美元。
艾利森引述華爾街日報的一篇專欄文章,指中國的工程師總數是美國的9倍,且STEM(科學、技術、工程、數學)畢業生數量更是美國的15倍,提醒美國要培養人才,亦要流住人才,特別是中國的科技人才。
如何才能留住人才呢?艾里森分析潘梓正最終選擇回流中國的原因,就是“硅谷公司未能在美國為他提供發展的機會”。而這也不是美國第一次失去關鍵科技人才了。艾利森特別舉例接受在美國教育的航太工程師錢學森,就是因為政治問題而被逼離開美國。當年有指錢學森申請入籍美國不獲批,于1955年更被美國驅逐出境。
錢學森回到中國后受到了最高規格的禮遇,其后領導成功打造“兩彈一星”,令中國躍身核武大國,并擁有可與美國匹敵的洲際導彈。
艾里森慨嘆,潘梓正并不是美國第一個失去的超級天才,也不會是最后一個,“這也提醒著我們,美國必須認真看待吸引人才、留住人才,包括來自中國的人才,尤其在中美科技競賽中?!?/p>
輝達高級研究科學家禹之鼎最近也分享了對潘梓正回國的看法。他說,潘梓是輝達2023年夏季的實習生,而當時的 DeepSeek多模態團隊只有3個人,不過潘梓正最后毫不猶豫選擇了后者。
禹之鼎形容, 潘梓正參與包括DeepSeek-VL2、Deepseek-V3和Deepseek-R1等多個關鍵項目,發揮了重要貢獻,這是他近年來看到的一個典型例子:很多最優秀的人才都來自中國,而這些人才并不一定只能在美國公司取得成功,“相反,我們從他們身上學到很多東西”。
據報道,潘梓正在哈爾濱工業大學軟件工程學士學位,在阿德萊德大學獲電腦科學碩士,2021年加入蒙納許大學ZIP Lab攻讀電腦科學博士。博士期間,他專注研究深度神經網絡效率,包括模型部署、Transformer架構優化、注意力機制、推理加速和內存高效訓練等。
潘梓正2024年全職加入DeepSeek擔任研究員。在DeepSeek在App Store下載榜登頂第一時,他在社交平臺分享自己的感受稱:“這一刻對我來說真是太精彩了?!?/p>