28日,記者從市場監(jiān)管總局獲悉,《人工智能大模型》系列國家標(biāo)準(zhǔn)近日正式實施,標(biāo)志著我國大模型產(chǎn)業(yè)進入“科學(xué)權(quán)威、統(tǒng)一規(guī)范”新階段。
市場監(jiān)管總局相關(guān)負責(zé)人介紹,作為首部聚焦通用大模型的國家標(biāo)準(zhǔn),該系列標(biāo)準(zhǔn)填補了技術(shù)評價體系空白,明確了性能、安全與服務(wù)能力要求,配套評測能力已獲中國合格評定國家認可委員會認可。
基于此構(gòu)建的“求索”-LMBench評測基準(zhǔn),整合方法、數(shù)據(jù)集與自動化平臺,成為行業(yè)公認的“能力標(biāo)尺”。評測體系已形成主流大模型白名單,為央企、國企選型提供依據(jù),并支撐中國石化、南方電網(wǎng)等建設(shè)行業(yè)大模型,完成對華為盤古、訊飛星火、中國移動“九天”等模型的場景驗證。
截至目前,標(biāo)準(zhǔn)工具已完成千余項評測任務(wù),調(diào)用大模型超95萬次,精準(zhǔn)識別幻覺控制、內(nèi)容安全等共性問題,助力近30家廠商技術(shù)迭代,推動形成“研發(fā)―評測―應(yīng)用―升級”閉環(huán)。
此外,標(biāo)準(zhǔn)國際化也在同步推進。面向東盟編制英語、老撾語、高棉語版本,填補了區(qū)域空白;中國開源模型架構(gòu)已被新加坡等國的項目采用,彰顯標(biāo)準(zhǔn)引領(lǐng)下的全球影響力。