• <li id="oo0oo"></li>
  • <li id="oo0oo"></li>
  • <li id="oo0oo"><tt id="oo0oo"></tt></li>
    <li id="oo0oo"></li>
  • DeepSeek R1中美下載榜登頂,如何顛覆AI格局,Nvidia夜盤急挫5%

    發布時間:2025-01-27 15:37

    國產AI黑馬DeepSeek(深度求索,Deep Seek)自1月20日正式發布大模型DeepSeek R1后,因其在數學、編程和推理等關鍵領域與OpenAI的最強模型性能相當,而且API調用成本低90%至95%,震驚市場。該應用程序更在蘋果中國和美國地區App Store免費下載榜中登頂,其中在美國地區下載榜上更超越ChatGPT。

    DeepSeek R1中美下載榜登頂

    DeepSeek對股市有何影響?

    Saas概念股向上 英偉達急跌

    在憧憬AI應用普及下,有關消息刺激多只在港上市Saas概念股向上,其中醫渡科技(2158)曾升逾6%、匯量科技(1860)及微盟(2013)亦曾分別升6%及5.4%。芯片股亦見受壓,中芯(981)曾跌3%;華虹半導體(1347)曾跌逾3%;晶門半導體(2878)更曾跌6%。此外,AI芯片龍頭英偉達(Nvidia,NVDA)亦因此利淡,在部份券商平臺美股夜盤急跌逾5%至135.15美元。

    AI行業專家如何評價DeepSeek R1?

    綜合媒體報道,DeepSeek R1的驚艷表現引來多位AI行業專家和從業者盛贊。百度(9888)前首席科學家吳恩達在冬季達沃斯論壇上表示,對DeepSeek的進展印象深刻,并認爲他們能夠以非常經濟的方式訓練模型。

    微軟CEO吁認真對待中國

    微軟行政總裁Satya Nadella也公開表示,DeepSeek切實有效地開發了一款開源模型,在推理計算方面表現出色,而且超級計算效率極高;他更強調,「我們必須非常、非常認真地對待中國的這些進展」。

    AI競爭格局有何改變?

    DeepSeek的成功更獲外媒形容為「標志著中國在人工智能領域日益強大的自主創新能力」。英國《金融時報》文章指出,DeepSeek并非個例,自去年中開始,阿里巴巴(9988)、 騰訊(700) 、字節跳動等中國科企持續縮小與美國同行差距,除了在能力方面逐漸趨近,更在成本效益上實現超越,而且這種增長效率并非偶然。

    開源模型趕上閉源模型

    至于DeepSeek的另一熱議焦點,是在于開源模型趕上閉源模型,可能改變競爭格局。事實上,OpenAI的閉源是其主導AI行業格局的一大特征。不過,Meta首席AI科學家Yann LeCun表示,DeepSeek得益于開放生態,其創新基于前人成果的持續迭代,顯示了開源模型正在超越閉源系統。華爾街頂級風投A16z創始人Marc Andreessen更稱,DeepSeek-R1是其見過最令人驚嘆、最令人印象深刻的突破之一,并且是「開源」、是「給世界的禮物」。

    值得留意的是,Tesla行政總裁馬斯克曾對OpenAI的閉源提起訴訟。在去年2月29日,馬斯克向舊金山高等法院控告OpenAI背離公共開源AGI的承諾,提出違約、違反受托責任和不公平商業行為等指控,要求法院命令OpenAI恢復開源狀態,阻止OpenAI及其總裁、CEO,以及微軟從AGI技術中獲利,并對OpenAI使用捐款進行清查。不過,馬斯克的努力尚未使OpenAI開源,但DeepSeek正以開源姿態贏得更多認可。

    DeepSeek創辦人是誰?何時成立及崛起?

    DeepSeek創辦人為梁文鋒,1985年出生于廣東省湛江市,今年約40歲,浙江大學畢業,擁有信息與電子工程學系學士和碩士學位。他早于2008年起開始帶領團隊使用機器學習等技術探索全自動量化交易,到2015年正式成立幻方量化,2019年資金管理規模更突破百億元。

    直到2023年,梁文鋒宣布進軍通用人工智能領域,專注于做真正人類等級的人工智能;同年幻方量化正式宣布成立大模型公司DeepSeek。

    在2023年11月2日,公司已推出首個模型DeepSeek Coder,該模型免費供商業使用且完全開源;11月29日推出DeepSeek LLM,參數規模達67B,性能接近GPT-4,同時還發布了聊天版本DeepSeek Chat。

    DeepSeek被稱為「價格屠夫」及「AI界拼多多」

    真正讓Deepseek在AI界受關注,是其在去年5月開源的第二代MoE大模型DeepSeek-V2,該模型在性能上比肩GPT-4 Turbo,價格卻只有GPT-4的百分之一,因此被稱為「價格屠夫」及「AI界的拼多多」。隨后在2024年下半年,還先后發布了DeepSeek R1-lite-preview和DeepSeek-V3。

    直到今年推出R1模型,在MATH基準測試上達77.5%準確率,與OpenAI的o1不相上下;在編程領域,R1在Codeforces評測中達2441分水平,高于96.3%的人類參與者。更重要的是,這是在不到600萬美元的投入和2048塊低性能的H800芯片的條件下完成,訓練時間僅用兩個月,令全球側目。

    DeepSeek VS ChatGPT

    若將DeepSeek與ChatGPT性能作比較,DeepSeek在MATH 500、AIME 2024和Codeforces等數學和編程測試中,表現優于ChatGPT和其他主流模型。在多任務理解和復雜問題處理方面,兩者表現相當,雖然DeepSeek在部分測試中略低于Claude,但整體上仍優于大多數模型。

    上下文理解能力較弱

    不過,ChatGPT在響應速度和文字生成方面較佳,其首次響應時間通常在1秒以內,DeepSeek則需要1.1秒左右,同時ChatGPT每秒可生成100個TOKEN,DeepSeek則為87.5個TOKEN。此外,DeepSeek一個較明顯弱點是上下文理解能力較弱,只能記住13萬個TOKEN的上下文,而ChatGPT和Claude則能記住200萬個TOKEN。

     以上內容歸星島新聞集團所有,未經許可不得擅自轉載引用。


    熱門文章
    久久五月综合婷婷私