具身智能評測將“有標可依”
關(guān)鍵詞: 具身智能 行業(yè)標準 評測 機器人
近日,中國信息通信研究院聯(lián)合40余家單位共同起草的具身智能領(lǐng)域首個行業(yè)標準正式發(fā)布。該標準為具身智能領(lǐng)域構(gòu)建了統(tǒng)一基準測試框架,標志著具身智能評測邁入“有標可依”的新階段。 據(jù)了解,這項標準聚焦人工智能關(guān)鍵基礎(chǔ)技術(shù)和具身智能基準測試方法,明確了具身智能系統(tǒng)框架和能力要求,將于6月1日正式實施。 “具身智能正處于從實驗室走向商業(yè)化落地的關(guān)鍵階段。”中國信息通信研究院人工智能研究所所長魏凱說。 數(shù)據(jù)顯示,2025年,國內(nèi)整機企業(yè)數(shù)量超140家,發(fā)布人形機器人產(chǎn)品超330款。 然而,魏凱認為,目前具身智能產(chǎn)業(yè)發(fā)展面臨兩大瓶頸。一是“作坊式”研發(fā)模式。模型調(diào)優(yōu)和部署往往極度依賴算法工程師的經(jīng)驗;數(shù)據(jù)散落在各家數(shù)采廠,難以有效整合和復用;硬件多為非標組裝,交付后往往需要廠家進行“保姆式”維護和調(diào)試,難以規(guī)模化交付。二是“碎片化”生態(tài)格局。模型性能與本體強綁定,換個硬件就容易失效;系統(tǒng)能力高度依賴具體場景的實訓效果,場景一變就容易失靈;供應鏈缺乏統(tǒng)一標準,導致技術(shù)成果難以復用,產(chǎn)業(yè)鏈協(xié)同效率不高。 “可信具身智能評測體系正是連接技術(shù)研究與大規(guī)模產(chǎn)業(yè)應用的橋梁,為行業(yè)提供統(tǒng)一的技術(shù)規(guī)范框架,建立互信基礎(chǔ),推動具身智能從‘作坊式’開發(fā)走向產(chǎn)業(yè)化發(fā)展。”魏凱說。 在他看來,建立評測體系就是為行業(yè)打造一把可信標尺,量出真智能、好產(chǎn)品、強可靠。 一方面,通過驗證模型在真實場景下的泛化能力和部署成效,標準幫助用戶區(qū)分真智能與炫技,可以倒逼企業(yè)研發(fā)真正可規(guī)模化、可復制的具身基礎(chǔ)模型。另一方面,標準讓企業(yè)明確什么是合格的產(chǎn)品,從而降低技術(shù)選型和適配成本,優(yōu)化整個產(chǎn)業(yè)鏈供應鏈的資源配置。 “全面評估具身智能在復雜環(huán)境下的穩(wěn)定性與可靠性,也可以為產(chǎn)品大規(guī)模落地提供安全保障。”魏凱說,“更重要的是,有了這把可信標尺,產(chǎn)業(yè)鏈上下游就有了共同的協(xié)同基礎(chǔ),技術(shù)研發(fā)、硬件制造、場景應用能夠有效銜接。” 新發(fā)布的標準規(guī)范了在仿真環(huán)境和真實環(huán)境下,面向具身智能系統(tǒng)的基準測試框架、方法和指標。這項標準提出的評測體系支持基礎(chǔ)能力、認知推理能力以及全鏈路閉環(huán)能力的測試,覆蓋靜態(tài)仿真測試、動態(tài)仿真測試、真實環(huán)境測試和組合式測試四種方法。 “作為具身智能領(lǐng)域首份正式發(fā)布的行業(yè)標準,具身智能基準測試方法的出臺對推動技術(shù)進步、應用落地和產(chǎn)業(yè)發(fā)展具有重要意義,為行業(yè)發(fā)展指明了方向。”魏凱說。 其中,技術(shù)研發(fā)層面,這項標準為具身智能的能力評估提供了統(tǒng)一的度量依據(jù),能夠指引技術(shù)迭代方向,幫助行業(yè)及早識別高價值技術(shù)路線,減少研發(fā)資源的無效投入;應用落地層面,為行業(yè)用戶開展產(chǎn)品選型與應用驗證提供標準規(guī)范支撐,避免“劣幣驅(qū)逐良幣”;產(chǎn)業(yè)發(fā)展層面,將加速具身智能從實驗室走向真實場景,促進具身智能技術(shù)成果的工程化落地和產(chǎn)業(yè)化應用。 魏凱認為,自主評測標準的建立有助于引導全國的創(chuàng)新資源向符合我國產(chǎn)業(yè)優(yōu)勢和技術(shù)路線的方向匯聚,避免在他人設(shè)定的賽道上被動追趕。此外,評測標準一旦成熟并被國際采納,將有利于我國具身智能產(chǎn)品、方案、平臺出海,進一步打造具身智能領(lǐng)域的“中國樣板”。(記者 崔 爽)
【責任編輯:朱家齊】