人民日报北京3月19日电(记者王云杉)记者从国(guo)家数据局获悉:我国(guo)7个数据标注基地数据标注规模再创新高,总规模达到17282TB,相(xiang)当于中国(guo)国(guo)家图书馆数字资源总量的(de)6倍左右。
数据标注是(shi)对数据进行添加标记、说(shuo)明、说明、分类和(he)编码的(de)过程,是(shi)提升人工智能算法、模型核心能力(li)的(de)关键(jian)环节。我国(guo)7个数据标注基地分别位(wei)于四(si)川成(cheng)都(dou)、辽宁沈阳、安徽合肥、湖南长沙(sha)、海南海口、河北保定和(he)山西大同,目前已形成(cheng)医疗(liao)、工业、教育等行业的(de)高质量数据集335个;赋能121个国(guo)产人工智能大模型研发;引进和(he)培育标注企业223家;标注从业人员达5.8万人;带动数据标注行业相(xiang)关产值超过83亿元。