數據資源和數據標注是發展人工智能及未來產業的重要數據基礎層。其中,數據標注是人工智能算法得以有效運行的關鍵環節,數據標注師堪比人工智能的“老師”。今年5月,合肥入選全國首批“數據標注基地建設任務城市”名單。
為了發揮高教資源優勢,促進數字經濟發展,7月11日上午,“聚焦數據資源 深化產教融合 賦能新質生產力”全國數據資源產教融合共同體成立大會在合肥新站高新區召開。新站將以此為契機,加快數據標注產業生態構建、能力提升和場景應用,計劃在未來三年內,引進和培育數據標注項目10家以上、從業人員超5000人。
產教融合 “掘金”數據資源
當前,通用人工智能浪潮席卷全球。而人工智能要理解世界,必須將客觀世界轉變成機器可識別的信息。而數據標注就是對未經處理過的語音、圖片、文本、視頻等數據進行加工處理,讓人工智能可以“看到”和理解。因此,數據的數量和質量,很大程度上決定了大模型的“智商”,沒有數據標注,人工智能就無法在智能化場景中應用、迭代。
2024年5月,在第七屆數字中國建設峰會上,合肥入選首批承擔數據標注基地建設任務的城市。而正圍繞“1324”發展戰略,大力培育人工智能、未來產業等4個百億級產業鏈群的新站高新區,也將數據資源和數據標注作為產業發展的重要數據基礎層。
為此,在高校畢業生就業協會指導下,新站高新技術產業開發區管理委員會聯合合肥工業大學、安徽圖聯科技有限公司、安徽國際商務職業學院等單位,發揮新站高新區新興產業及高教資源優勢,牽頭成立了“全國數據資源產教融合共同體”,將其打造成培養高層次技術技能人才的重要搖籃,集聚大數據企業、培育壯大數據產業生態的重要平臺,以及推動新站高新區數字經濟發展的重要引擎。
匯聚全國上百家高校和企業
“全國數據資源產教融合共同體”匯聚相關企業、普通高校、職業院校、行業組織、科研機構等多方力量。理事會候選成員包括來自117家單位,包括來自全國各地企業家代表共280余人,其中,學校75家、企業42家。
“全國數據資源產教融合共同體” 正式成立后,新站高新區將致力于:
優化數據服務生態,通過政策引導、集群發展等措施,匯聚更多數據服務提供商和數據企業入駐,打造活力的數據服務生態。
加強產學研合作,與高職院校、研究機構和應用類企業緊密合作,在產業數字化、經濟數字化的進程中,為屬地培育新型職業人才,如人工智能訓練師,自動駕駛標注師,內容審核工程師,大數據統計師等。
構建多元化的數據服務,針對不同行業和應用場景,提供定制化的數據服務解決方案,助力企業快速構建和部署AI大模型。
數據標注產業加快興起
近年來,新站高新區錨定人工智能及元宇宙等未來產業方向,積極探索數據資源價值延伸,培育構建基礎數據服務體系,在地理信息、平臺經濟等優勢領域快速打造行業高質量數據集。目前,新站高新區數據標注產業加快匯聚,形成數據采集、數據清洗、數據標注、數據應用為一體的基礎數據服務體系,為大模型企業提供專業數據服務。而圖聯科技作為教育部唯一授權全國數據資源產教融合共同體發起單位,已與國內百余所學校合作,正在新站高新區積極打造國內領先的數據資源生產基地。
安徽圖聯科技有限公司董事長曹鳳英表示,安徽圖聯科技將在全國數據資源產教融合共同體組織內,整合上下游產業資源,聯合職業院校,積極投入建設一批數據資源現代產業學院和開放型區域產教融合實踐中心,共同研發專業課程、創新教學模式,培養雙師型教師隊伍,促進高質量的對口就業,推動教育鏈、人才鏈與產業鏈、創新鏈的有機銜接。
按照計劃,未來3年內,新站高新區將引進和培育數據標注項目10家以上、從業人員超5000人,推進數字經濟相關產業營收超400億元,打造數據集應用典型案例,為促進人工智能產業生態發展提供有力支撐。
大皖新聞記者 項磊 實習生 唐雪玲
編輯 陶娜
請輸入驗證碼