新華社記者 嚴賦憬
記者20日從國家數(shù)據(jù)局了解到,我國七個數(shù)據(jù)標注基地數(shù)據(jù)標注規(guī)模再創(chuàng)新高,數(shù)據(jù)標注總規(guī)模達到17282TB,相當于中國國家圖書館數(shù)字資源總量的6倍左右。
數(shù)據(jù)標注是對數(shù)據(jù)進行添加標記、說明、解釋、分類和編碼的過程,是提升人工智能算法、模型核心能力的關(guān)鍵環(huán)節(jié)。我國七個數(shù)據(jù)標注基地分別位于四川成都、遼寧沈陽、安徽合肥、湖南長沙、海南海口、河北保定和山西大同,目前已形成醫(yī)療、工業(yè)、教育等行業(yè)的高質(zhì)量數(shù)據(jù)集335個;賦能121個國產(chǎn)人工智能大模型研發(fā);引進和培育標注企業(yè)223家;標注從業(yè)人員達5.8萬人;帶動數(shù)據(jù)標注行業(yè)相關(guān)產(chǎn)值超過83億元。
國家數(shù)據(jù)局有關(guān)負責人表示,未來將進一步暢通數(shù)據(jù)采集、標注、人工智能應用產(chǎn)業(yè)鏈,重點推動工業(yè)、金融、醫(yī)療、交通、教育等幾大領(lǐng)域的高質(zhì)量數(shù)據(jù)集建設(shè),促進數(shù)據(jù)標注產(chǎn)業(yè)高質(zhì)量發(fā)展。