日韩av免费无码一区二区三区,狠狠色丁香久久综合

行業(yè)新聞

地址：江蘇揚州寶應柳堡工業(yè)園區(qū)

電話：0514-88771180 88237498

傳真：0514-88771180 88237498

手機：13801440979 15262252185

網址：http://www.jiutiandzkj.com

Email：569455601@qq.com

DeepSeek如何影響算力行業(yè)電力需求

發(fā)布者：發(fā)布時間：2025-4-8 閱讀：40次

DeepSeek通過模型算法優(yōu)化，在顯著降低訓練成本與能耗的情形下，實現了與國際頂尖大模型相當的智能水平。對于算力行業(yè)的電力需求而言，一方面，DeepSeek的系列優(yōu)化技術可以有效減少芯片運算，降低當前算力行業(yè)的電力需求；另一方面，DeekSeek將適配更多的國產GPU芯片，有效緩解“卡脖子”問題并激發(fā)社會的普遍應用，進而導致用電總量的提升。因此，有必要分析DeepSeek的電力影響邏輯，研判未來算力行業(yè)的電力需求變化趨勢并有效應對。

技術上看，DeepSeek引領的算法優(yōu)化、疊加開源的傳播優(yōu)勢，將促使算力行業(yè)由“算力”驅動轉向“算力+算法”并重，進而影響未來算力行業(yè)的電力需求。

以ChatGPT為代表的傳統(tǒng)大模型，主要由堆砌算力和樣本量提升大模型能力。DeepSeek帶來的系列大模型技術，通過“樣本、架構、編程、應用”四方面優(yōu)化算力需求，將影響未來算力行業(yè)的電力需求邏輯。

樣本方面，傳統(tǒng)的通算、智算訓練一般采用32位或16位精度，而DeepSeek的訓練采用了16位和8位混合精度框架。如未來算力行業(yè)均采用該精度，則相較于傳統(tǒng)的32位精度，訓練量將降低50%，甚至75%。且隨著GPU芯片對低精度樣本更好地適配，將帶來算效的提升，從而使訓練能耗顯著降低。

架構方面，通過僅激活部分參數，大模型推理可以實現更低的算力消耗。DeepSeek的MLA和MOE架構，相較于其他大模型激活的參數量占比更少，疊加“開源”優(yōu)勢，有望吸引其他大模型模仿學習。若其他大模型未來推理過程中，激活參數占比降至DeepSeek同等水平，則能夠整體降低推理能耗的60%~70%。

編程方面，DeepSeek通過高水平編寫更底層的PTX語言，繞開英偉達成熟的CUDA架構，提升GPU利用率（MFU）約60%，向全球展示了算力緊張情景下的高效解決方案。但該技術的實現依賴于高級編程人才，預計多數大模型公司仍將選擇CUDA架構，未來能耗壓降有限，但能有效緩解算力“卡脖子”問題。

應用方面，DeekSeek使用知識蒸餾技術，從6710億全參數模型中蒸餾出15億、70億、140億、700億參數的多類型小模型，避免重新訓練。由于“免費+開源”的疊加效應，DeepSeek極大降低了大模型應用門檻，預計未來社會應用將爆發(fā)式增長，帶動能耗的整體上升。

行業(yè)來看，DeepSeek引發(fā)的生態(tài)變革，疊加國內政策與國際競合因素，將促使社會應用需求發(fā)生變化，預計未來將呈現出“先穩(wěn)后升”的用電態(tài)勢。

模型技術主要影響算力需求，除算力需求外，用電量還受到數據中心PUE、算力設備負載率等因素的綜合影響。DeepSeek引發(fā)模型技術之外行業(yè)生態(tài)變革，可能改變行業(yè)生態(tài)因素，從而影響整體用電需求。

目前，我國智能算力占比不足40%，雖然預計在2028年將達到75%，但目前仍以通用算力為主。DeepSeek帶來模型技術變革，當前主要作用于智算行業(yè)，通算和超算行業(yè)應用該類技術需進一步適配和調整。因此，DeepSeek帶來的能耗壓降影響，將不會在短期內大量釋放。

傳統(tǒng)大模型對算力規(guī)模的高要求，決定了主要的訓練工作在中大型算力中心完成。DeepSeek對算力規(guī)模需求的降低，將使得中小型算力中心也具備模型訓練和微調的能力。一方面，社會使用的擴大將對沖掉部分先進技術對能耗的壓降；另一方面，中小型算力中心PUE（約1.3~1.5）相較于大型算力中心PUE（約1.1~1.3）普遍較高，也將對沖掉部分能耗壓降的規(guī)模。

目前，英偉達GPU市場占有率超過90%，隨著AMD、華為等公司宣布針對DeepSeek進行芯片適配，英偉達的芯片壟斷將被打破，引入競爭將進一步降低GPU價格。根據杰文斯悖論，預計芯片國產化適配后，未來大模型在制造、信息、材料、家居等行業(yè)的應用將更為普遍，長遠來看將進一步拉升全社會用電量。

能源行業(yè)有必要積極關注社會訓練、推理算力的用電趨勢分化，未來可以考慮將部分社會應用模式創(chuàng)新納入能源行業(yè)大模型應用體系。

從全國一體化算力網加快建設的態(tài)勢來看，未來訓練需求將集中于各樞紐節(jié)點。短期內，DeepSeek模型優(yōu)化技術將對沖訓練需求上升，電力電網設施配套不宜過早、過多、過快；長遠看，未來訓練算力需求將持續(xù)增加，樞紐節(jié)點是算力保電重點，有必要因時因地、分層分級地精細劃分裕度區(qū)間，避免資源錯配錯位。

研究認為，由于數字、電商、高端制造等產業(yè)的聚集效應，以及大模型應用的可復制性和擴散效應，DeepSeek帶來的社會應用增長，將率先在數字經濟發(fā)達區(qū)域出現，需及時研判供電保電壓力變化。

DeepSeek類蒸餾小模型推理算力需求低、能耗低、開源優(yōu)勢明顯，有望在用戶側以小規(guī)模算力實現大量部署，催生出多種創(chuàng)新應用模式。建議持續(xù)關注社會應用模式創(chuàng)新，優(yōu)化能源行業(yè)“集中—分散”硬件資源布局，借鑒納入無人機智能巡檢、智能機器人等能源行業(yè)專業(yè)應用。

來源：強電磁技術全國重點實驗室網站

打印本頁 || 關閉窗口

午夜免费视频,九九热在线视频精品店,亚洲欧美日韩v在线播放,午夜欧美精品久久久久久久

來源：強電磁技術全國重點實驗室網站