亚洲一区av在线,992人人tv香蕉国产精品,久久精品无码一区二区三区

Deepseek推動大模型平價化，降低開發(fā)成本，為下游端側(cè)和應(yīng)用側(cè)打開市場空間，催生大量推理算力需求。IDC預(yù)測2026年中國智能算力規(guī)模年復(fù)合增長率達52.3%，增長源于推理端需求釋放，大模型應(yīng)用中推理算力需求超訓(xùn)練算力。國內(nèi)各廠商已積極開展布局適配DeepSeek的多類型算力芯片的推理框架，實現(xiàn)推理算力效率最大化、提升DeepSeek推理速度、創(chuàng)新業(yè)務(wù)模式等，增強其在DeepSeek推理方向的市場競爭力。

模型推理簡介

模型推理是指利用已訓(xùn)練模型對新輸入數(shù)據(jù)進行預(yù)測或決策的計算過程，其核心目標(biāo)是通過高效、準(zhǔn)確、實時的輸出解決實際問題。與模型訓(xùn)練不同，模型推理是其后續(xù)流程的一環(huán)，具體來看：

訓(xùn)練階段是計算密集型任務(wù)，旨在依托大量預(yù)處理數(shù)據(jù)，運用隨機梯度下降等方法歷經(jīng)復(fù)雜迭代，持續(xù)調(diào)校模型參數(shù)來探尋數(shù)據(jù)規(guī)律，其特點在于需要處理大規(guī)模數(shù)據(jù)集和復(fù)雜的梯度計算，通常依賴于高性能GPU的并行計算能力，對顯存容量和帶寬要求高，需要高速互聯(lián)保證多卡協(xié)同運行，通常要求千卡及萬卡級以上。同時模型訓(xùn)練伴隨多次梯度迭代，對于數(shù)據(jù)的精準(zhǔn)度通常要求較高，通常計算精度要求FP16及以上。

推理階段，模型參數(shù)固定，更多屬于訪存密集型任務(wù)，更注重低延遲和高吞吐量的前向傳播，單次計算量較小，但高并發(fā)場景下整體算力需求仍會增加，依據(jù)應(yīng)用場景對于數(shù)據(jù)精度要求差異，目前場景以FP16、FP8、int8計算精度為主，一些特殊場景如科學(xué)計算等需要FP32或FP64。

模型推理過程主要涉及推理算力、推理框架、推理應(yīng)用。推理框架作為模型推理的“操作系統(tǒng)”，簡化推理部署及開發(fā)復(fù)雜性，屏蔽底層的算力資源差異，支撐上層應(yīng)用開發(fā)。其優(yōu)化部署技術(shù)主要包括KV Cache、服務(wù)調(diào)度優(yōu)化技術(shù)、顯存優(yōu)化、Offload技術(shù)、量化技術(shù)、解碼優(yōu)化及其變體等。通過減少計算和內(nèi)存需求加速推理，滿足實時性要求、降低部署成本，如專注于高性能推理和服務(wù)的開源框架vLLM、SALang、以及在CPU推理方面表現(xiàn)良好的llama.cpp等推理框架，企業(yè)根據(jù)實際芯片和模型需求的自研框架。

DeepSeek推理盈利引爭議，技術(shù)與商業(yè)博弈凸顯

3 月 1 日，DeepSeek 官方在《DeepSeek-V3 / R1 推理系統(tǒng)概覽》中首次披露成本利潤率，理論值高達 545%。然而，潞晨科技曾表示DeepSeek R1推理部署有虧損風(fēng)險并宣布暫停 DeepSeek API 服務(wù)模式。一方面是DeepSeek推理的巨大成本利潤率545%，另一方面是企業(yè)賣DeepSeek API（MaaS）每月虧本4億元，出現(xiàn)兩種相反觀點的主要原因在于：在推動推理服務(wù)商業(yè)化進程中，保障用戶體驗需被置于首要位置，這要求企業(yè)需儲備大量冗余智算資源。據(jù)浪潮開展的相關(guān)調(diào)研測算，當(dāng)前我國智算中心的平均算力使用率維持在 30%上下，為確保推理服務(wù)能為用戶帶來優(yōu)質(zhì)體驗，需維持近70% 的算力資源冗余，大量冗余需要大量的資金投入。反觀DeePSeek則通過算力資源統(tǒng)籌管理、生態(tài)合作實現(xiàn)了高盈利。一是“見縫插針”用顯卡，即白天高負荷全節(jié)點部署推理，夜間低負荷時釋放節(jié)點用于訓(xùn)練/研究的模式，論測算僅考慮資源的效率。二是DeepSeek推理盈利模式多元，以ToB服務(wù)的API調(diào)用收費為主，與垂直行業(yè)合作，通過生態(tài)衍生業(yè)務(wù)如開發(fā)者工具、云服務(wù)、數(shù)據(jù)服務(wù)等來盈利，如DeepSeek 與教育、醫(yī)療、金融等領(lǐng)域展開合作，將技術(shù)轉(zhuǎn)化為針對性解決方案，推出智能教學(xué)助手、病例分析系統(tǒng)、客服機器人等產(chǎn)品，業(yè)務(wù)覆蓋超 20 個垂直行業(yè)。

DeepSeek推理算力、推理框架、推理應(yīng)用三方面賦能 AI 產(chǎn)業(yè)新生態(tài)

DeepSeek 憑借自身在硬件優(yōu)化、模型創(chuàng)新及自研推理框架等方面的優(yōu)勢，為國內(nèi)模型推理相關(guān)AI產(chǎn)業(yè)發(fā)展提供新機遇。

（一）推理算力方面，DeepSeek模型推理通過性價比優(yōu)勢推動國產(chǎn)算力在推理側(cè)的滲透。DeepSeek推理通過混合專家模型（MoE）動態(tài)選擇合適的專家模塊處理，減少計算量，保證推理準(zhǔn)確的前提下降低成本。如推理定價方面，DeepSeek R1（$0.14/百萬輸入tokens）較OpenAI o3-mini（$1.1/百萬輸入tokens）更便宜。目前華為昇騰、海光信息、摩爾線程、昆侖芯、燧原科技等AI芯片廠商，相繼宣布適配或上架 DeepSeek 模型服務(wù)，其中昇騰910C芯片針對MoE模型動態(tài)路由優(yōu)化使推理效率提升50%。截至今年2月20日，已有超過30家軟硬件企業(yè)基于昇騰推出DeepSeek一體機方案2，并超過80家企業(yè)基于昇騰上線DeepSeek，服務(wù)全國超70%區(qū)域。

（二）推理框架方面，DeepSeek利用硬件親和的工程優(yōu)化，充分發(fā)揮了受限顯卡（H800）的性能，為國產(chǎn)芯片廠商發(fā)展提供了新范式。DeepSeek用更接近底層硬件的匯編語言PTX，對計算過程進行更細粒度的控制，開發(fā)了通信和數(shù)據(jù)分配模塊進行優(yōu)化，擺脫了部分cuda庫，充分發(fā)揮底層GPU的計算性能。因此，在硬件受限的情況下，通過算法創(chuàng)新和工程優(yōu)化可部分彌補芯片性能差距。目前科技廠商已推出自研推理框架（與國產(chǎn)芯片適配）服務(wù)于DeepSeek，如澎峰科技已完成基于海光DCU的自研推理框架PerfXLM +，并深度適配、優(yōu)化 DeepSeek 全系列模型。2月25日智源研究院聯(lián)合多個芯片廠商開發(fā)并開源了 DeepSeek-R1 多芯片版本，其異構(gòu)并行訓(xùn)推框架 FlagScale可適配多芯片，能夠一鍵部署 DeepSeek-R1 模型服務(wù)和自動分布式推理調(diào)優(yōu)能力。

（三）推理應(yīng)用方面，DeepSeek憑借開源、高效推理能力助推眾多行業(yè)實現(xiàn)智能化轉(zhuǎn)型，尤其在工業(yè)領(lǐng)域?qū)崿F(xiàn)明顯的降本增效。富士康引入DeepSeek優(yōu)化iPhone主板貼片生產(chǎn)線，節(jié)拍時間縮短12%，產(chǎn)能提升至120萬臺/日。燧原科技基于DeepSeek全量模型在慶陽、無錫、成都等智算中心實現(xiàn)“數(shù)萬卡”快速落地，硬件成本降低超30%。聯(lián)想通過DeepSeek多模態(tài)模型提升智能質(zhì)檢的缺陷識別準(zhǔn)確率至99%以上，并借助時序預(yù)測模型優(yōu)化供應(yīng)鏈管理，助力企業(yè)降本超20%。

國內(nèi)AI相關(guān)企業(yè)模型推理發(fā)展建議

（一）建議以混合部署模式構(gòu)建 DeepSeek 推理算力體系，如將 NVIDIA 硬件與昇騰硬件協(xié)同部署。著重強化對運維團隊的專業(yè)技術(shù)培訓(xùn)，確保團隊成員能夠精通 NVIDIA 與昇騰兩種硬件的運維管理。在提升 DeepSeek 推理算力性能表現(xiàn)與運行可靠性的同時，有效規(guī)避因過度依賴單一技術(shù)路線而可能引發(fā)的潛在風(fēng)險，為相關(guān)企業(yè)在AI領(lǐng)域的業(yè)務(wù)拓展筑牢堅實的技術(shù)根基。

（二）建議依托 vLLM 等現(xiàn)有的開源推理框架，全力開展自研DeepSeek 推理框架對混合異構(gòu)算力的適配工作。在推理框架設(shè)計中，建議以國產(chǎn)芯片為主導(dǎo)、英偉達 GPU 為補充，充分利用國產(chǎn)芯片的性價比優(yōu)勢和英偉達GPU的高性能特點。確保在充分滿足推理性能要求的同時，實現(xiàn)成本的最大化削減，僅在國產(chǎn)芯片難以勝任的復(fù)雜計算任務(wù)或?qū)π阅苡袠O致要求的關(guān)鍵環(huán)節(jié)合理采用英偉達 GPU，實現(xiàn)性能與成本的最優(yōu)平衡。

（三）建議積極探尋并挖掘工業(yè)領(lǐng)域推理應(yīng)用場景。組建專業(yè)的行業(yè)調(diào)研團隊，深入各類工業(yè)企業(yè)內(nèi)部，全面、細致地了解其生產(chǎn)流程、現(xiàn)存痛點問題以及對智能化和安全性的具體需求。基于調(diào)研結(jié)果，量身定制基于 DeepSeek 的工業(yè)解決方案，精準(zhǔn)滿足工業(yè)企業(yè)的實際業(yè)務(wù)訴求，助力其實現(xiàn)智能化轉(zhuǎn)型升級。

免费成人在线观看视频_中文字幕一区二区三区久久_久久精品91_日韩成人在线播放_日本精品久久久_91精品一区二区三区久久久久久

從Deepseek看，模型推理的盈利思辨與產(chǎn)業(yè)賦能