在當前由大模型和AIGC(人工智能生成內(nèi)容)驅(qū)動的AI時代,算力需求暴增,同時還面臨供給不足、供需匹配難、能耗激增等挑戰(zhàn),算力產(chǎn)業(yè)亟須由“量”向“質(zhì)”加速高質(zhì)量發(fā)展。近日,《人工智能算力高質(zhì)量發(fā)展評估體系報告》在2024中國算力大會期間發(fā)布,旨在助推高質(zhì)量算力從概念到落地。
該報告由浪潮信息聯(lián)合中國信息通信研究院發(fā)布。報告首次完整地構建了人工智能時代高質(zhì)量算力的理論體系,并探索性地提出業(yè)界首個“五位一體”的高質(zhì)量算力評估體系。
目前我國算力產(chǎn)業(yè)正處于由“量的擴張”轉向“質(zhì)的提高”這一重要關口,算力發(fā)展從規(guī)模速度型粗放增長轉向質(zhì)量效率型集約增長,算力產(chǎn)業(yè)規(guī)模擴張下開始以應用為導向,從過去的重資產(chǎn)、重硬件模式向軟硬協(xié)同、服務驅(qū)動等高質(zhì)量發(fā)展方向轉型升級。高質(zhì)量算力以其高性能和高效率優(yōu)勢引領著新質(zhì)生產(chǎn)力的新方向,推動技術創(chuàng)新、產(chǎn)業(yè)升級、經(jīng)濟轉型,助力經(jīng)濟社會向更高層次發(fā)展。
報告對人工智能時代的“高質(zhì)量算力”予以明確定義:高質(zhì)量算力是基于最新人工智能理論,采用先進人工智能的計算架構,與算法、數(shù)據(jù)深度結合的高水平計算能力。高質(zhì)量算力具備高算效、高智效、高碳效、可持續(xù)、可獲得、可評估“三高三可”六大特征。
高算效是指在提高算力理論算效的同時考慮更高的實測性能和資源利用率。理論算效主要體現(xiàn)的是部件和系統(tǒng)能力,2023年年底,全國在用算力中心平均理論算效為11.8GFlops/W,僅達到GB/T 43331-2023《互聯(lián)網(wǎng)數(shù)據(jù)中心(IDC)技術和分級要求》中通用算力算效第三等級,表明算效水平仍有很大提升空間。實測性能體現(xiàn)的是應用場景下的實測性能,如單位時間內(nèi)處理的Token數(shù)量、運行時延、模型訓練時間、數(shù)據(jù)處理質(zhì)量等指標。當前算力集群實測性能和理論性能差距過大問題明顯,部分算力實際性能不足理論性能的10%。資源利用率則關注的是算力資源利用水平。據(jù)公開數(shù)據(jù)顯示,傳統(tǒng)模式下的智算中心GPU利用率平均數(shù)值低于30%。高算效就是要破解上述算效水平不高、算力資源利用率較低等問題。
此外,高質(zhì)量算力還具備可持續(xù)、可獲得和可評估三大特征?沙掷m(xù)是指算力具備技術兼容、供應鏈完備、生態(tài)開放的特性,能夠保證算力持續(xù)供給和升級迭代?色@得是指算力普適普惠,能夠適用各種應用場景,同時算力使用成本較低?稍u估是指可通過完整、有效的評估體系反映算力系統(tǒng)實際應用情況。
聚焦高質(zhì)量算力“三高三可”特征,報告提出了以系統(tǒng)設計提升算效、協(xié)同驅(qū)動提升智效、全生命周期管理提升碳效、基建先行推動算力普適普惠、繁榮生態(tài)推動算力可持續(xù)發(fā)展、多元評估加速算力規(guī)范化發(fā)展的高質(zhì)量算力發(fā)展路徑,有效推動算力發(fā)展“提質(zhì)增效”,讓高質(zhì)量算力助力經(jīng)濟社會實現(xiàn)數(shù)智化轉型和高質(zhì)量發(fā)展。
同時,報告還結合人工智能時代算力發(fā)展面臨的機遇與挑戰(zhàn),針對算力系統(tǒng)從算效水平、智效水平、碳效水平、可持續(xù)水平、可獲得水平5個維度推出面向人工智能時代的“五位一體”高質(zhì)量算力評估體系。