• <li id="oo0oo"></li>
  • <li id="oo0oo"></li>
  • <li id="oo0oo"><tt id="oo0oo"></tt></li>
    <li id="oo0oo"></li>
  • 新版DeepSeek最快本月發:讓華為芯片趕超英偉達

    發布時間:2025-08-12 16:17

    ChatGPT-5已經發布,那么國產大模型DeepSeek大版本更新也就不遠了。

    從網友向DeepSeek提出的問題看,該模型給出的答案是,DeepSeek-R2預計將在2025年8月15日至8月30日之間發布。

    s_36de92801fc742dca9e94bc127c22049

    在這樣的背景下,國產算力鏈多家公司股價出現了大漲,比如寒武紀直接今天20cm漲停,股價創歷史新高,市值突破3550億元。

    按照之前的說法,DeepSeek-R2大模型將會采用一種更先進的混合專家模型(MoE),其結合了更加智能的門控網絡層(Gating Network)以優化高負載推理任務的性能。

    有分析師預計,DeepSeek-R2的定價可能顯著低于OpenAI同類產品,預示著其可能顛覆現有AI服務的定價模式。

    此外,還有相關消息顯示,DeepSeek-R2預計比GPT-4成本下降97%;并且是在昇騰卡上做的訓練,主打一個全方位全產業鏈的自主可控。

    據相關人士透露的情況,DeepSeek-R2的總參數量可能會達到1.2萬億,比DeepSeek-R1的6710億參數增加大約一倍。

    DeepSeek-R2是一款基于華為昇騰910B(Ascend 910B)芯片集群訓練的模型,在FP16精度下達到512PetaFLOPS的計算能力,芯片使用效率為82%。

    據華為實驗室統計,這個性能相當于英偉達上一代A100訓練集群的91%左右。至于這些是不是真實的,還有待觀察,但看起來確實更強大、更自主了。

    來源︱快科技
    編輯︱梁景琴
    久久五月综合婷婷私