新华社北京3月20日电(记者(zhe)严赋憬)记者(zhe)20日从国(guo)家(jia)数据局了解到(dao),我国(guo)七个数据标注基(ji)地数据标注规模再创新高,数据标注总规模达(da)到(dao)17282TB,相(xiang)当(dang)于中国(guo)国(guo)家(jia)图(tu)书馆数字(zi)资源总量的6倍左右(you)。
数据标注是对数据进行添加标记、说明、说明、分类和(he)编码的过程,是提升人工智能算(suan)法、模型核心能力的关键环节。我国(guo)七个数据标注基(ji)地分别位于四川成都、辽宁(ning)沈阳、安徽合肥、湖南长沙、海南海口、河北保定和(he)山西大同,目前已(yi)形成医疗、工业、教育等(deng)行业的高质量数据集335个;赋能121个国(guo)产人工智能大模型研发;引(yin)进和(he)培育标注企业223家(jia);标注从业人员达(da)5.8万人;带动数据标注行业相(xiang)关产值超过83亿元。
国(guo)家(jia)数据局有关负(fu)责人表示,未来将进一步畅通(tong)数据采集、标注、人工智能应用产业链,重点推动工业、金融、医疗、交通(tong)、教育等(deng)几大领域的高质量数据集建设,促进数据标注产业高质量发展。(完(wan))