數據標注通過對數據加工處理,以提升數據供給質量,推動人工智能發(fā)展。國家發(fā)展改革委13日發(fā)布消息,國家發(fā)展改革委、國家數據局等部門近日印發(fā)《關于促進數據標注產業(yè)高質量發(fā)展的實施意見》,提出到2027年,數據標注產業(yè)專業(yè)化、智能化及科技創(chuàng)新能力顯著提升,產業(yè)規(guī)模大幅躍升,年均復合增長率超過20%。

業(yè)內專家認為,高質量數據短缺是當前人工智能大模型發(fā)展中遇到的瓶頸。數據標注產業(yè)是對數據進行篩選、清洗、分類、注釋、標記和質量檢驗等加工處理的新興產業(yè),能夠產生高質量的數據集,讓機器讀得懂、學得快、訓得好。

意見提出培育一批具有影響力的科技型數據標注企業(yè),打造一批產學研用聯動的創(chuàng)新載體,建設一批成效明顯、特色鮮明的數據標注基地。此前,我國已確定成都、沈陽、合肥、長沙等7個城市承擔數據標注基地建設任務。

針對當前人工智能對于公共數據標注需求越來越多的情況,意見提出釋放公共數據標注需求,深化人工智能在政務服務、城市治理、鄉(xiāng)村振興等領域應用,編制公共數據標注目錄,依法依規(guī)有序推動公共數據標注與開發(fā)利用。

為增強創(chuàng)新驅動,意見提出支持軟硬一體、自主可控的數據標注領域關鍵設備研發(fā)。在優(yōu)化支撐體系上,意見提出加大財稅金融支持力度,各地區(qū)各部門可結合實際,統(tǒng)籌安排數據產品和標注服務采購費用;同時加強標注人才隊伍建設,制(修)定人工智能訓練、數據標注相關職業(yè)國家職業(yè)標準。