近日,全球權(quán)威市場研究機(jī)構(gòu) IDC 發(fā)布《AI 原生云/新型云廠商重構(gòu) Agentic 基礎(chǔ)設(shè)施》報告,深度剖析生成式 AI(GenAI)爆發(fā)背景下,AI 基礎(chǔ)設(shè)施市場的變革趨勢與核心玩家價值。報告明確指出,“AI 原生云廠商憑借穩(wěn)定的供應(yīng)鏈、顯著的價格優(yōu)勢及專業(yè)化能力,已在 AI 基礎(chǔ)設(shè)施市場站穩(wěn)腳跟”,并將 GMI Cloud 與 CoreWeave 列為新型 AI 原生云廠商中的重點調(diào)研推薦對象,從技術(shù)實力、生態(tài)資源、產(chǎn)品布局及戰(zhàn)略視野四大維度,肯定其在推動企業(yè) GenAI 落地中的核心作用。

IDC 洞察 AI 應(yīng)用市場焦點:AI 原生云成 GenAI 跨越“PoC 到生產(chǎn)”關(guān)鍵,推理與合規(guī)需求凸顯
IDC 在報告中強(qiáng)調(diào),當(dāng)前亞太地區(qū)企業(yè) GenAI 采用率呈爆發(fā)式增長——65%的亞太企業(yè)將在 2025 年實現(xiàn)超 50 個 GenAI 場景投產(chǎn),26%的企業(yè)甚至計劃部署超 100 個場景。但企業(yè)在從概念驗證(PoC)向規(guī)模化生產(chǎn)邁進(jìn)時,面臨三大核心挑戰(zhàn):高性能推理基礎(chǔ)設(shè)施短缺、數(shù)據(jù)主權(quán)合規(guī)壓力、多云環(huán)境下資源調(diào)度效率低。
隨著大模型預(yù)訓(xùn)練逐漸收斂,IDC 在報告中明確預(yù)判:“2025 年起,AI 基礎(chǔ)設(shè)施市場焦點將全面轉(zhuǎn)向推理側(cè)”,而推理場景對 “高吞吐、大并發(fā)、成本可控” 的需求,正倒逼廠商突破傳統(tǒng)技術(shù)架構(gòu)。報告數(shù)據(jù)顯示,2025 年亞太地區(qū)使用 AI 推理基礎(chǔ)設(shè)施的組織占比已達(dá) 84%,但超過 24% 的企業(yè)仍受 “基礎(chǔ)設(shè)施成本過高” 困擾,如何在 “性能” 與 “成本” 間找到平衡點,成為行業(yè)核心挑戰(zhàn)。
對此,IDC 明確提出解決方案方向:“企業(yè)應(yīng)優(yōu)先選擇地域鄰近、供應(yīng)鏈穩(wěn)定的專用 AI 基礎(chǔ)設(shè)施,尋找具備 GPU 加速能力、支持混合云部署且符合區(qū)域合規(guī)要求的 AI 原生云合作伙伴”。而這一判斷,恰好與 GMI Cloud 的核心戰(zhàn)略高度契合,也成為報告重點關(guān)注并推薦 GMI Cloud 的關(guān)鍵依據(jù)。
同時,GMI Cloud 自研雙引擎突破性能瓶頸,匹配 IDC“推理效率優(yōu)先”趨勢。針對 IDC 強(qiáng)調(diào)的“2025 年 AI 基礎(chǔ)設(shè)施焦點轉(zhuǎn)向推理側(cè),需滿足高吞吐、大并發(fā)與成本平衡”需求,GMI Cloud 自研 Cluster Engine 與 Inference Engine 雙引擎,形成技術(shù)壁壘:
- Cluster Engine(IaaS 層):提供靈活彈性的資源調(diào)度能力,支持長期預(yù)留與按需使用結(jié)合的模式,同時支持定制化私有云服務(wù)、K8s 集群管理、InfiniBand 虛擬化組網(wǎng),確保企業(yè)數(shù)據(jù)安全與資源效率最大化,契合 IDC“模塊化、可定制計算服務(wù)”的推薦標(biāo)準(zhǔn);
- Inference Engine(MaaS 層):集成全球近百個前沿大語言模型、語音及視頻生成模型,通過對開源模型的深度優(yōu)化,實現(xiàn) API 調(diào)用延時縮短、Token 吞吐效率提升,同時提供差異化定價的 on demand 模型部署托管服務(wù),幫助企業(yè)平衡“性能需求與成本控制”,直接響應(yīng) IDC“需優(yōu)化 AI 項目總擁有成本(TCO)”的建議。同時,作為面對 AI 推理場景的核心引擎,其具備高并發(fā)、低延遲及動態(tài)彈性擴(kuò)縮容能力,能夠精準(zhǔn)匹配全球范圍內(nèi)企業(yè)對推理基礎(chǔ)設(shè)施“彈性適配業(yè)務(wù)波動”的核心訴求。