今年1月,中國人工智能初創公司DeepSeek的開源模型R1早前震撼AI產業,其中英偉達(Nvidia,NVDA)單日市值一度蒸發近6000億美元。英偉達創辦人黃仁勛首度回應DeepSeep,指其R1推理模型“令人印象深刻”,并推動整個行業發展,AI未來發展仍依賴算力,對芯片的需求不減反增。
上月底,DeepSeek橫空出世令美股科技股受創,因DeepSeek在模型構建和訓練中使用的芯片性能及成本都較低,讓投資者擔心未來大型科企或減少對英偉達高端芯片產品的需求,導致英偉達股價在1月27日曾暴跌17%,單日市值蒸發超6000億美元,惟近日已收復大部分失地。
“后訓練”才是最重要部分
據報黃仁勛近日在一場線上活動的預錄訪問中指,市場當時對R1的反應是“人工智能結束了!它從天而降,我們不再需要進行任何算力了!而事實恰恰相反?!?/p>
黃仁勛說:“在投資者角度來看,過去都有一種心智模型,的認為AI是先進行預訓練,然后進行推理,而推理就是向AI提問并立即得到答案?!彼毖赃@種觀念錯誤。他說即使預訓練仍然重要,但“后訓練”(post-training)才是最重要的部分,也是“學習解決問題的關鍵環節”,教AI模型更好地“推理”是科技行業的下一個擴展前沿,仍依賴巨大的算力。
黃仁勛又稱贊DeepSeek的創新為人工智能領域注入了新的活力,隨著R1的開源,世界各地熱情高漲。
專題 更多 >
熱門文章