中商情報網訊:在 AI 產業鏈中,算法、算力和數據共同構成技術發展的三大核心要素。算法模型從技術理論到應用實踐的落地過程依賴于大量的訓練數據。訓練數據越多、越完整、質量越高,模型推斷的結論越可靠。
近年來,深度學習加速了人工智能技術的商業化落地,同時也帶來了大量Al算法訓練需求,推動基礎數據服務市場的快速增長。根據德勤數據統計,2017-2022年中國人工智能基礎數據服務市場規模從8.2億元增長至45.0億元,年均復合增長率達41%。未來智能制造、元宇宙、生成式AI等復雜智能場景的實現,將對人工智能基礎數據服務提出了更高的要求。預計2023年其市場規模將達到63.5億元。
數據來源:IDC、德勤、中商產業研究院整理
行業發展趨勢
1.人工智能技術加速向產業滲透融合,催生更多垂向領域數據需求
隨著深度學習技術的不斷突破,人工智能發展已經進入 2.0 時代,相關訓練需求正逐漸從通用基礎能力建設,向更為專業的垂向場景/行業拓展。一方面,以大模型為代表的 AI 基礎技術不斷取得重大突破,AI 模擬人類認知的能力飛速提升,因此從技術能力維度看,AI 已具備與垂直產業融合并規模化應用的前提條件;另一方面,受國家數字經濟發展戰略推動,產業數字化和智能化將進一步席卷各行各業,智能化技術與傳統產業的融合將成為數字經濟時代的新發展趨勢,并創造出巨大的藍海空間。
當前 AI 技術正在加速與各類產業融合,在汽車、金融、醫療、工業等傳統行業的滲透率和應用場景不斷提升,展現出可觀的商業價值和巨大的發展潛力,而數據作為打通算法技術與行業需求的核心橋梁,作用更加凸顯,可以說數據能力一定程度上決定了算法模型在對應產業的適用性以及實用性,成為加速 AI 產業化落地的關鍵要素。
在各類垂向場景中,智能駕駛受益于其產業本身的高速發展,以及以智能化為核心驅動的底層邏輯,相關數據需求呈現出快速增長趨勢,因此成為數據服務行業首個產生規模化需求的垂向領域。未來,隨著智能駕駛級別的不斷提升、以及滲透率的不斷提高,產業對智能駕駛的算法的精度要求會更高,一方面在硬件配置上,傳感器的種類和數量會不斷變化,另一方面,算法需要持續不斷地學習更多場景的數據來提高罕見場景的識別能力,因此,未來智能駕駛的數據需求將向覆蓋更多數據類型、更廣泛應用場景以及更高質量的方向發展,數據需求也將從原來單一的 2D 需求(主要集中在 L2 級別)向 3D、以及 2D-3D 融合需求拓展(L3 及以上級別)。
2.人工智能企業全球化布局加速,多語種能力成為拓展核心支撐
2013 年,共建“一帶一路”的倡議正式面世,十年來,隨著國家“一帶一路”戰略的深入推進,國內一批具有較強創新能力和過硬技術實力的企業,紛紛踏出國門,積極拓展海外市場,通過不斷擴大企業出海戰略版圖,獲得高速發展機會。另一方面,境外頭部企業也繼續踐行“全球化”戰略,搭乘全球出海的快車。隨著境內、外企業的全球化擴張成為確定性趨勢,多語種能力作為支撐企業順利出海的核心要素之一,重要意義更加凸顯。未來,多語種訓練數據將對客戶側在語音助手、智能汽車、智能家居、智能客服、機器人、多語種 OCR 等各領域產品/應用的全球化推廣起到積極作用。因此,隨著各類客戶群體擴張步伐加速,多語種需求也將快速增長,具有強大語言研究能力的數據服務企業將獲得更多商業機會。
3.多模態數據受 AIGC、元宇宙發展驅動,將呈現快速增長趨勢
隨著 AI 虛擬主播、虛擬學生、虛擬員工輪番上崗,虛擬數字人這個新興概念逐漸走入大眾視野,成為元宇宙與人工智能兩大領域的熱門技術賽道之一。想要讓虛擬數字人實現與人類的自然交互,不僅需要發音標準自然、身體動作流暢,其表情、口型與聲音也要實現細節的精準匹配,而多模態技術就是打破傳統人工智能單一感官局限、讓各類 AI 能力協同使用的重要技術。通過對高質量多模態訓練數據集的持續學習,AI 可實現圖像、視頻、音頻、語義文本等多維度能力的融合,使得虛擬人在行為上更接近人類。
此外,隨著 AIGC 技術的發展,AI 將在更多維度上輔助人類創作,例如人類輸入一段文字指令,AI 通過理解輸入的文字內容,按照人類描述生成一幅畫或一段語音,以此幫助人類完成內容生產。想要實現上述功能,即需要通過對多模態數據進行學習,使文字與圖畫或語音形成一一映射,通過對齊兩種獨立模態關鍵特征的方式,實現按指令的創作。因此,隨著以虛擬人、AIGC 為代表的 AI 技術的不斷發展和應用,數據服務領域多模態需求將呈現加速增長趨勢。
4.大模型技術的突破和躍升,將驅動新型數據需求持續增長
隨著 ChatGPT 成為全球范圍內的現象級應用,人工智能迎來了新的發展機遇,其背后的大模型技術也將進一步引導人工智能產業變革并帶來相關數據需求的變化和增長。具體來說,為更好完成預訓練階段的通用模型訓練,大量數據的質量要求將更高,高質量數據清洗的規則建立以及工程化能力將成為重點。此外,強化學習階段的高階數據需求將不斷增加,基于人類認知的高質量的數據輸入將更大程度決定模型效果。
5.隨著國家法律法規更快更密集落地,對數據安全及合規會提出更高要求
近年來,數字經濟規模的快速擴張,數據作為數字經濟時代最核心、最具價值的生產要素,重要性更加凸顯,但數據不同于傳統生產要素,其承載涵蓋了大量涉及個人隱私以及國家安全的重要信息,因此,為更好保障數字經濟長期穩定的可持續發展,建設規范、安全、合規、高質量的數據安全體系已成為迫切需求。近年,國家陸續出臺包括《數據安全法》、《個人信息保護法》、《汽車數據安全管理若干規定(試行)》、《數據出境安全評估辦法》、《自然資源部關于促進智能網聯汽車發展維護測繪地理信息安全的通知》等主流法律法規,為解決數據安全問題、凈化行業快速發展中的不良亂象提供了切實可行的法律依據。
更多資料請參考中商產業研究院發布的《中國人工智能市場前景及投資機會研究報告》,同時中商產業研究院還提供產業大數據、產業情報、行業研究報告、行業白皮書、商業計劃書、可行性研究報告、園區產業規劃、產業鏈招商圖譜、產業招商指引、產業鏈招商考察&推介會等服務。