在国家数据局指导下,经全国数据标准化技术委员会(以下简称“全国数标委”)归口管理,我院牵头申报的《高质量数据集 建设运营能力成熟度模型》国家标准(计划号:20262357-T-907)近日正式获批立项。目前,标准编制工作已全面启动,正面向产业界广泛征集参编单位,加快开展文本起草与技术研讨。

该标准是我国高质量数据集系列标准中,首个聚焦建设运营全过程系统性能力评估的成熟度模型类标准,旨在为人工智能领域“以数据为中心”转型中面临的“不会建、不敢用、不会评”等突出问题提供系统性解决框架,为产业高质量发展提供规范化指引。
凝聚产业核心资源,构建全链条协同生态
作为牵头单位,我院联合国家工业信息安全发展研究中心、国家数据发展研究院、中国电子技术标准化研究院、交通运输部科学研究院、中国质量认证中心等机构,以及海天瑞声、华为、库帕思、帕西尼等产业链核心企业,覆盖AI数据集供应、全栈技术、语料战略、具身智能数据商业化等关键环节,并吸纳央国企建设应用、工业数字化转型、交通运输等垂直领域代表,初步形成贯穿标准体系、技术研发、建设运营、应用验证的完整生态闭环。
当前,标准编制组持续开放征集参编单位,欢迎具备数据建设运营实践经验的企事业单位、科研机构、行业组织参与,共同完善标准技术内容,增强标准的产业适用性与权威性。
聚焦行业应用场景,明确能力建设路径
当前,人工智能发展范式加速向“以数据为中心”转变,高质量数据集已成为驱动大模型创新与行业智能化转型的关键基础资源。然而,产业各方在数据集建设运营中普遍面临能力建设路径不清晰、质量管控手段不足、价值释放机制欠缺等挑战,亟需系统性的能力评估与提升指引。
该标准将构建覆盖组织管理、工程建设、质量管控、安全合规、技术工具、运营管理六大能力域,以及初始级、规范级、稳健级、优化级、引领级五级成熟度等级的能力评估框架。重点纳入数据增强、数据价值优化、自动化与智能化等创新要求,推动数据集从静态资产向持续运营的价值载体转变,为工业AI、自动驾驶、智慧医疗等战略性新兴产业提供高可靠的数据支撑,填补国内外在高质量数据集建设运营全过程系统性能力评估方面的标准空白。
该标准可用于企业、政府部门、公共机构、科研机构及高校等各类组织,主要服务于三类场景:一是组织自我评估,作为自查清单,识别数据工作优势、短板与改进方向,指导内部投资与流程优化;二是采购方或合作方评估,作为甄别工具,评估目标企业能力可靠性,降低合作风险;三是第三方评估,由具备资质的认证机构依据标准开展正式评估,颁发成熟度等级证书,作为组织数据能力的客观证明。
夯实数据全栈能力,贯通标准研制与检测认证
我院在数据领域已建立覆盖标准预研、标准制定、试点验证到检测认证的全流程服务能力。依托电子数据检验技术中心、物联网实验室等技术平台,我院已取得中国合格评定国家认可委员会(CNAS)和中国计量认证(CMA)资质,具备开展数据质量相关评估认证的技术能力。
在此基础上,我院正规划建设人工智能数据集标准测试验证公共服务平台,面向多模态数据集提供检测分析、质量评估、知识产权登记、合规治理等服务。本次国家标准的研制,将为我院开展高质量数据集建设运营能力成熟度评价奠定标准基础,也为产业提供可落地、可评估、可优化的技术依据。
后续,我院将在国家数据局和全国数标委指导下,联合各参编单位加快推进标准文本起草、征求意见、试点验证与应用推广工作,确保标准技术内容的科学性、适用性与前瞻性,为我国“人工智能+”行动落地提供标准化支撑。(产业所 赵莹)