新华社北京3月20日电(记者严赋憬)记者20日从国家(jia)数据局了解到,我国七个数据标注基地数据标注规模再创新高,数据标注总规模达到17282TB,相(xiang)当于中国国家(jia)图书馆数字资源总量的6倍(bei)左右。
数据标注是对数据进行添加标记、说明、说明、分类和编码的过程,是提升人(ren)工智能(neng)算法、模型核(he)心能(neng)力的关键环节。我国七个数据标注基地分别位于四川(chuan)成(cheng)都、辽(liao)宁沈阳、安徽合肥、湖南(nan)长(chang)沙、海南(nan)海口、河北保定和山西大(da)同,目前已形(xing)成(cheng)医(yi)疗、工业、教育等(deng)行业的高质量数据集335个;赋能(neng)121个国产人(ren)工智能(neng)大(da)模型研发;引进和培(pei)育标注企业223家(jia);标注从业人(ren)员达5.8万人(ren);带动数据标注行业相(xiang)关产值超过83亿(yi)元。
国家(jia)数据局有关负责人(ren)表示(shi),未来将进一(yi)步畅通(tong)数据采集、标注、人(ren)工智能(neng)应用产业链,重点推动工业、金融、医(yi)疗、交(jiao)通(tong)、教育等(deng)几大(da)领域的高质量数据集建设(she),促进数据标注产业高质量发展。(完)