《网络安全技术 生成式人工智能预训练和优化训练数据安全规范》(征求意见稿)
国家标准《网络安全技术 生成式人工智能预训练和优化训练数据安全规范》(征求意见稿)编制说明
一、工作简况
1.1任务来源
为加强网络安全国家标准在国家网络安全保障工作中的基础性、规范性、引领性作用,全国网络安全标准化技术委员会调研国家网络安全重点工作和技术产业发展需求,研究形成了2023年网络安全国家标准需求清单,含《网络安全技术 生成式人工智能预训练和优化训练数据安全规范》。2023年5月,北京中关村实验室联合相关单位参与申报该标准,于2023年8月份通过全国网络安全标准化技术委员会立项。
1.2 制定背景
2022年11月底,生成式人工智能的出现引发各方广泛关注。为促进生成式人工智能技术健康发展和规范应用,2023年4月11日,国家互联网信息化办公室起草的《生成式人工智能服务管理办法(草案)》向全社会公开征求意见。其中,第七条有关“生成式人工智能产品的预训练数据、优化训练数据”条款备受关注。2023年4月13日,全国网络安全标准化技术委员会发布《关于发布2023年度第一批网络安全国家标准需求的通知》,将本标准纳入2023年网络安全国家安全标准需求项目。2023年7月13日,《生成式人工智能服务管理暂行办法》正式公布,并已于2023年8月15日正式施行。
2023年8月25日,全国网络安全标准化技术委员会发布《全国信息安全标准化技术委员会关于2023年第一批网络安全国家标准项目立项的通知》,明确本标准由北京中关村实验室作为项目牵头单位负责标准编制工作。
1.3 起草过程
1、2023年4月,北京中关村实验室牵头组建标准前期研究工作小组,小组对研究《生成式人工智能管理办法(征求意见稿)》,广泛收集专家对办法的讨论与解读,形成相应标准草案,并准备申报材料。
2、2023年6月,北京中关村实验室编制组在全国网络安全标准化技术委员会2023年第一次“标准周”上进行标准汇报,通过组内成员单位投票。标准编制组根据意见进行认真修改。
3、2023年8月,全国网络安全标准化技术委员会发布《全国信息安全标准化技术委员会关于2023年第一批网络安全国家标准项目立项的通知》,同意本标准由北京中关村实验室作为项目牵头单位负责标准编制工作。
4、2023年9月,北京中关村实验室召开标准研讨会,继续完善标准草案,并对外公开征集标准参编单位。
5.2023年10月,北京中关村实验室正式成立标准编制组,召开国家标准制定启动会,并就标准草案内容向参编单位征集贡献,对标准内容进行完善。
6.2023年11月,北京中关村实验室编制组在全国网络安全标准化技术委员会2023年第二次“标准周”上进行标准汇报。SWG-BDS工作组对标准进行了审议并行成“修改完善后转为征求意见稿”结论。标准编制组根据意见进行认真修改。
二、标准编制原则、主要内容及其确定依据
2.1 标准编制原则
本标准的编制遵循以下原则:
(1) 先进性:标准反映当前《生成式人工智能服务管理暂行办法》等最新法律要求以及生成式人工智能的先进技术水平;
(2)开放性:标准的编制、评审与使用具有开放性;
(3)适应性:标准结合我国国情;
(4)简明性:标准易于理解、实现和应用;
(5)中立性:公正、中立,不与任何利益攸关方发生关联;
(6)一致性:术语与国内外标准所用术语最大程度保持一致。
本标准通过“数据通用安全”和“数据处理安全”两个维度,对生成式人工智能服务的研发者开展预训练和优化训练过程中涉及的数据处理过程安全保护要求作出明确规范,以实现降低生成式人工智能服务遭受数据投毒、恶意诱导性提示等安全威胁目的。
2.2 主要内容及其确定依据
本项目旨在于支撑《生成式人工智能服务管理暂行办法》第七条对预训练和优化训练等训练数据处理活动规范的落地实施,试图明确生成式人工智能服务研发者在预训练和优化训练等训练数据处理活动中的数据来源等方面的管理要求,解决生成式人工智能服务可能存在的被诱导生成侵害他人知识产权、个人信息等问题,提高生成式人工智能服务的安全性。
2.3 修订前后技术内容的对比[仅适用于国家标准修订项目]
不适用。
三、试验验证的分析、综述报告,技术经济论证,预期的经济效益、社会效益和生态效益
3.1 试验验证的分析、综述报告
本文件规定了生成式人工智能预训练和优化训练数据及其处理活动的安全要求,描述了对应的评价方法。
本文件适用于指导生成式人工智能服务提供者开展预训练和优化训练数据处理活动以及开展与训练预训练和优化训练数据安全自评价,也可为监管评估提供参考。
北京中关村实验室牵头制定本标准,并承担标准应用推广工作。国家计算机网络应急技术处理协调中心、中国电子技术标准化研究院、清华大学、北京深言科技有限责任公司、北京面壁智能科技有限责任公司、北京智谱华章科技有限公司等单位将承担标准应用试点和技术支持任务。
本标准编制过程主要分为标准文本编制及完善、标准试点工作等。前期以北京中关村实验室为牵头单位,组织联合申报单位充分调研学术界、产业界相关情况后共同撰写修改标准草案。标准完善后,在北京深言科技有限责任公司、北京面壁智能科技有限责任公司、北京智谱华章科技有限公司等参与单位展开标准试点工作。
3.2 技术经济论证
虽然落实本标准提出的安全要求,在短期内给生成式人工智能服务研发者增加了经济成本,包括但不限于:新增知识产权等方面合规人员的成本、开发分类模型等数据识别清洗计算机程序的成本、安全风险自评估的成本等,但这些成本能够有效增加生成式人工智能服务在社会公众使用、公众舆论方面的接受度和认可度,降低生成式人工智能服务在知识产权、个人信息等方面纠纷、争议的成本。总的来说,该技术标准给企业带来正面的经济效应。
3.3 预期的经济效益、社会效益和生态效益
该标准的社会效益在于保护生成式人工智能服务的安全性,减少生成式人工智能服务在侵害知识产权、个人信息等方面的风险,并在此基础上促进生成式人工智能服务商业方面的良性竞争。
该标准不涉及生态效益。
四、与国际、国外同类标准技术内容的对比情况,或者与测试的国外样品、样机的有关数据对比情况
目前生成式人工智能预训练和优化训练数据安全不存在对应的国际标准,也未见其他国家制定了对应的技术标准。
五、以国际标准为基础的起草情况,以及是否合规引用或者采用国际国外标准,并说明未采用国际标准的原因
当前,国际标准并没有对生成式人工智能预训练和优化训练数据安全开展标准化工作,其他国家也没有制定对应的技术标准,因此本标准制定工作中没有采用国际标准或国外标准。
六、与有关法律、行政法规及相关标准的关系
本标准与现行法律、法规以及国家标准不存在冲突与矛盾。
本标准为《生成式人工智能服务管理暂行办法》等法律法规的落地实施提供支撑,建议与标准《网络安全技术 生成式人工智能数据标注安全规范》等配套使用。
七、重大分歧意见的处理经过和依据
无。
八、涉及专利的有关说明
无。
九、实施国家标准的要求,以及组织措施、技术措施、过渡期和实施日期的建议等措施建议
本标准规定了生成式人工智能在预训练和优化训练过程中,对所使用数据的通用安全要求、数据处理方面的安全要求,以及评价方法,适用于面向我国境内公众提供生成式人工智能服务的组织或个人提高预训练及优化训练数据获取与准备的安全水平,可也为生成式人工智能的数据提供者提供参考。
十、其他应当说明的事项
无。
《网络安全技术 生成式人工智能预训练和优化训练数据安全规范》
标准编制组
2024年3月28日
标签:
相关文章:
响应式青少年成长训练营培训网站模板
邵阳公安,守护平安,您想知道哪些警情?,网站的用户中心建设方案
跑步机健身器材器械网站模板
做广告联盟赚钱有风险吗?网络广告联盟法律风险分析
新媒体广告,多平台推广新选择
日照站建站以来最大规模改造施工完成33岁刘亦菲拍宣传片,“十级滤镜”下变了样,超宽发缝遮不住
掌握了这6种免费的主流网络推广方法,引流获客不再是问题!
打造全新电商,构建高效购物平台
微信营销失败的4大原因
响应式茶叶批发公司网站模板
西班牙语中的“senorita”改写为“小姐”或“女士”
Yunci赋能,企业智云领航
思明互联网营销推广,互联网推广销售是做什么的?,眉山网站优化哪家好
挣钱网站有哪些?13个在家就能做的网上挣钱网站
汕头百度搜索神器
深圳网站优化性价比之选,高效提升流量曝光
微信好友怎么删?
抢红包狂欢季,速来参与!
打造全新销售网站,焕新体验!
海外网站搭建专家
淘宝全球购正品保障,如何开通?
闲鱼聊天技巧有哪些?
矩阵短视频运营
18年老网站套现!美图3964万美元收购设计网站站酷曾与刘德华翻脸,打吴京吐血,跟随成龙29年8万被开除,后靠打工维持生计
洁白新意
关键词提取 工具平台
名义收入和实际收入的区别
江小SEO,精准优化专家
深网先锋,推广领航者
博实股份:公司进行机器人系统的研发、设计、制造和系统集成应用,机器人核心控制算法程序为自主开发54岁女子相亲63岁男子,女方我好想嫁给你,男方我考虑一下
精准营销策略有哪些
如何用电脑直播快手游戏直播?
《勇者斗恶龙怪物仙境3》制作人采访:系列的定义在于配种因裤子太紧有勒痕,斗鱼米娜被判违规,本人在直播间崩溃大哭
响应式日用百化外贸网站模板
广州SEO优化,助力企业腾飞
百度:搜索引擎的大脑,如何解析海量信息?,青浦区网站优化机构
7月7日,高考?你准备好了吗?,沧县网站优化贵不贵
超级外链:关键词+?如何实现?,技术网站建设靠谱吗
网站被黑?逆袭重生,一键恢复!
家居清洁神器,你真的了解吗?,普洱茶网站怎么做推广的
市场营销和营销策划的区别
员工大会流程:标准化实施及要点梳理
文投控股下跌5.21%,报2.73元/股保姆小杨阿姨蹭大S流量,开启直播卖酸辣粉?看她的表情我牙酸了
移动前端开发和 Web 前端开发的区别是什么?
7步打造核心品牌营销推广方案?怎么做?
传奇人生,笔尖传颂
中小企业网络营销破局之道
网络营销精英班
拥抱网络机遇,抢占SEO制高点。
ChatGPT爆火插件:网页制作,看图写菜谱、解析代码等样样齐活儿广东相亲大会,一女子被8人看中,最漂亮的没人理,网友:谁敢娶