AI教母︱李飛飛花20美金26分鐘造出新模型，效果媲美DeepSeek | 星島環球網

<li id="oo0oo"></li>

<li id="oo0oo"></li>

<li id="oo0oo"><tt id="oo0oo"></tt></li>

首頁>美國>要聞

AI教母︱李飛飛花20美金26分鐘造出新模型，效果媲美DeepSeek

發布時間：2025-02-12 08:42

內地低成本高效的AI模型DeepSeek，推出后震撼科技界后，有AI教母之稱的美籍華裔科學家李飛飛，率領其團隊僅花了20美元及26分鐘，便創造出一個“s1”的AI推理模型，表現媲美OpenAI o1和DeepSeek R1等尖端推理模型。

▲李飛飛及其團隊只用了20美元，便創出效能媲美DeepSeek R1的新AI模型。路透社

▲李飛飛是斯坦福大學首位紅杉講席教授。Stanford University

▲DeepSeek的估值存在巨大分歧，估值區間在10億美元到1550億美元之間。路透社

僅用16塊H100 GPU訓練

綜合外媒報道，李飛飛是斯坦福大學首位紅杉講席教授，美國國家工程院院士。她與斯坦福大學和華盛頓大學的研究團隊，在一個月內便研發出s1模型，因像DeepSeek一樣并非從零開始。s1是以阿里巴巴的通義千問Qwen2.5 -32B-Instruct開源模型為底座，在16塊輝達(NVIDIA)H100 GPU上監督微調26分鐘，訓練出新模型。

表現媲美OpenAI o1及DeepSeek R1

報道指，李飛飛團隊在研究中提出了“預算控制”策略，透過加入“wait指令”等方式，強制延長模型推理過程、思考時間，以此促使模型自我檢查并修正錯誤的推理步驟，提升推理品質。

根據李飛飛等人的研究論文《s1：Simple test- time scaling》，該模型在數學和編碼能力測試中的表現，可媲美OpenAI的o1，以及DeepSeek的R1等尖端推理模型，在競賽數學問題上更較o1-preview高出27%。

內媒每日經濟新聞報道，復旦大學計算機學院副教授鄭驍慶受訪時表示：“像DeepSeek或類似的公司，在尋找有效的整合解決方案時，需要進行大量的前期研究與消融實驗?！边@意味著前期是需要大量“燒錢”的。

由于s1是基于現成模型進行監督微調，而微調一個模型和從零開始訓練一個模型的成本是無法相提并論的。其次50美元是否包含了其他數據、設備和消融實驗等費用，如DeepSeek-V3不到600萬美元的訓練成本，其實也只包含了訓練時的GPU算力費用。

相關閱讀

熱門文章

馬斯克效率部｜揭歷來最愚蠢研究：為顯而易見之事燒錢120萬美元韓國瑜愿協商總預算案吁喊停大罷免，賴清德搬“佛經”回應賴清德放任大罷免？藍揭綠盤算：優先壓制盧秀燕 22歲女生中學疑遭狼師性侵四年，獲大學錄取未逃陰霾抑郁輕生海巡署士官長指侵同袍妻，惡喊：你下面濕濕的！判賠金額出爐黃珊珊、林憶君沒投票！藍白聯手60：51封殺“選罷法”覆議案啦啦隊女神熱舞“馬甲下滑”！傲人上圍險走光民進黨再爆性騷擾，前黨工PO文控前主管“那天你喝多”，內容曝光 22歲女生中學時期遭性侵輕生，母親曾問淫師：你對我女兒做了什么葉珂下個月生女娃！閨蜜證實分手再爆：黃曉明不見得喜歡她

久久五月综合婷婷私