3月24日,国新办举行介绍第九届数字中国建设峰会有关情况的新闻发布会。国家发展改革委党组成员、国家数据局局长刘烈宏介绍了国家数据局在推进高质量数据集赋能人工智能发展方面的工作情况。
他说,国家数据局高度重视数据要素赋能人工智能创新发展的工作,我们提出人工智能发展到哪里,我们就把高质量数据集建设到哪里。“人工智能+”行动到哪里,行业高质量数据集的建设和推广就要到哪里。
他介绍,我们针对高质量数据集建设“小和散”的问题,会同26个部门组织遴选了72家高质量数据集建设链主单位、140个先行先试工作单位和104个典型案例,构建了链主带动、多方参与、联合攻关、共建共享、合作共赢的高质量数据集建设生态,从而持续推动高质量数据集的建设。
为推动数据标注产业发展,我们布局了成都、沈阳、合肥、长沙、海口、保定、大同7个承担数据标注先行先试建设任务的城市,出台了《关于促进数据标注产业高质量发展的实施意见》,遴选出47个数据标注优秀案例,指导举办了7次数据标注的供需对接会。
他表示,下一步,我们将面向科技创新强、发展基础好、产业特色优的地区,聚焦“知识密集型”和“技术驱动型”这两个方向,梯次布局一批技术先进、特色鲜明、高效赋能的数据标注产业创新试验区。
我们还持续培育“为高质量数据付费”的市场共识,推动行业高质量数据集在数据交易所挂牌、上架、交易。支持数据流通服务平台、数据商等机构提供流通交易的服务,鼓励各类数据流通服务机构探索多样化的高质量数据集流通利用模式,推动高质量数据集供需有序对接,支持行业高质量数据集流动起来。
在各方共同努力下,高质量数据集的建设工作取得了阶段性的成效,截止到2025年年底,全国已建成的高质量数据集超过了10万个,总体量超过了890PB,这相当于中国国家图书馆数字资源总量的310倍左右。到今年3月,我国日均Token的调用量,也就是词元的调用量,已经超过了140万亿,相比2024年初的1000亿增长了1000多倍,相比2025年底的100万亿,三个月时间又增长了40%多。
他说,日均Token调用量的大量增加,充分表明中国的人工智能发展进入了快速增长阶段,应用场景在不断深化,从能对话到能决策执行的智能体,中国人工智能产业的竞争力也显著增强,现在大家热议的Token出海,就是产业竞争力增强的一个标志。当然从数据的维度来看,也标志着数据集的供给在大量增加,数据要素的价值在不断释放,数据要素赋能人工智能创新发展进入了良性互动的阶段。
刘烈宏表示,下一步,我们将持续推进数据赋能人工智能创新发展,协同各方深入实施新一轮的高质量数据集建设行动计划,包括强基扩容、标注攻坚、提质增效、应用赋能、管理服务、价值释放六大专项行动,以场景需求为牵引,加快推进先行先试的工作,打造技术可行、实用便捷、质量保障的AI-Ready高质量数据集,实现高质量数据集供给的量质提升。
声明:本网转发此文,旨在为读者提供更多资讯信息,所渉内容不构成投资、建议消费。文章内容如有疑问,请与有关方核实,文章观点非本网站观点,仅供读者参考。
ChatGPT发展、数据安全应用2023“浦江护
“网络和系统如果被侵入,则是‘皮之不存,毛将焉附’。”中国科学技...
消息称TikTok正测试AI聊天机器人“Tako
,据路透社报道,以色列人工智能公司WatchfulTechnol...
LG42英寸C3OLED游戏电视降至7999元,
,LG在今年4月份推出了42英寸C3OLED游戏电视,首发到手价...
在比亚迪汉DM上看大场面才过瘾 购买自主中高端B
汉DM-i冠军版也好,汉DM-p战神版也罢,都将领衔中国品牌完成...
四大智能技术加持,售价11.68万元起一汽丰田新
5月21日,“一汽丰田智能电混技术发布暨新卡罗拉上市发布会”在珠...
中国餐桌上的法国美食更多了
近日,第六届中国国际进口博览会推介会在法国巴黎成功举办,不少法国...