國產人工智能大模型DeepSeek的火爆給市場帶來持久振奮,與此同時“贏麻了”、“DeepSeek羞辱OpenAI”等情緒化說辭也不脛而走。 官媒昨日發文指出,這類“速勝論”值得警惕,稱DeepSeek只是實現了算法創新驅動的效率革命,沒徹底改變全球AI發展格局,該領域中國仍處于追趕狀態,在基礎研究和算力等核心技術上與美國仍有差距。
▲官媒坦言,DeepSeek仍是在英偉達芯片集群上訓練而成。
今年初杭州人工智能公司DeepSeek發布同名最新大模型,給全球AI界扔下一枚科技核彈。 似乎一夜間,DeepSeek憑其強大的邏輯推理能力和語言能力、開發成本低廉等特點火爆全網,一度碾壓ChatGPT、 Google Gemini等其他頂尖AI軟件登頂中美App Store免費榜。
僅實現算法創新驅動效率革命
《北京日報》報業集團旗下新媒體“長安街知事”發長文寫道,DeepSeek的火爆給市場帶來持久振奮。 不過與之同時,“贏麻了”“DeepSeek羞辱OpenAI”“AGI實現了”“已超越美國”等情緒化說法不脛而走,背后的速勝論思維很值得警惕。
業界普遍認為,數據、算力、算法是人工智能發展的基礎三要素。 文章指出,從技術角度看DeepSeek打破了“高算力和高投入是發展人工智能唯一途徑”的迷信,然而“算力不足,算法來補”的成功并不意味著算力就不重要了。
文章坦言,DeepSeek仍是在英偉達芯片集群上訓練而成,沒有繞開英偉達CUDA程序設計框架。 英偉達依托后者構建的軟件生態,被認為是比芯片更高的技術護城河。 目前“DeepSeek+國產GPU(圖形處理器)”的新聞頻出,不過真正能滿血高效運行的恐怕不多。
真正能滿血高效運行不多
文章指出,隨著人類用于訓練AI的數據消耗殆盡,AI大模型將從“訓練時代”進化到“推理時代”,這無疑對芯片性能提出更高要求。 因此萬萬不能因DeepSeek的成功就認為毋須再彌補算力上的差距,相反更應在國產芯片替代與軟件生態構建方面有更強緊逼感。 DeepSeek的出現并未徹底改變全球人工智能發展格局,我國總體仍處于追趕狀態,在基礎研究和核心技術上與美國仍然有差距。