上海2022年3月18日 /美通社/ -- 近日,全球領先的專業市場調查機構IDC,分析了企業在人工智能應用開發的建設現狀及在數據服務方面的挑戰和需求,並發佈調研報告稱:澳鵬Appen作為一家全球領先的AI訓練數據服務提供商,在中國市場提供覆蓋AI全生命週期的數據解決方案,具備獨特優勢。
1. 中國AI市場快速發展,各行業AI落地的滲透率在逐步提高。
2. 企業採用AI的過程中,存在隱私問題和數據缺乏等挑戰,對數據服務的需求正在發生巨大變化。
3. 企業越來越重視AI數據以加快AI落地,對AI數據服務的需求越來越聚焦在質量、效率和安全。
4. 澳鵬Appen作為一家全球領先的AI訓練數據服務提供商,在中國市場具備獨特優勢,為企業提供AI生命週期中圖像、文本、語音、音頻和視頻的全棧式採集和標注服務及解決方案,其產品提供成品數據集產品和智能數據標注On-Promise/SaaS/Hybrid平台來積極滿足客戶的各種需求,在外語類和自動駕駛數據服務領域優勢突出。
聚焦中國人工智能市場,數據是關鍵
近幾年,中國人工智能市場迅猛發展,對豐富而優質的數據源的需求日益增加,成為AI數據服務市場的重要驅動力。據IDC預測,到2025年,中國人工智能市場整體規模將達到163億美元,五年CAGR將超過美國,走在全球前列。
隨著數字化轉型進入深水區,企業對人工智能技術的探索從單點應用拓展到多個業務場景,從信息化進入更高級的智能化階段。根據IDC調研,AI技術在互聯網、汽車、金融、政府、製造、能源、醫療等各行業中均已有所滲透,且正逐步從業務流程的"提質降本增效"向經營的全面智能化演進。
然而與此同時,IDC在2021年的一項調研中發現,全球企業在AI部署的過程中,面臨的三大挑戰分別是:前期成本高、缺乏MLOps專業知識以及數據科學專業知識,緊隨其後的是隱私問題,以及缺少訓練和測試數據。
深度神經網絡廣泛進入行業應用帶來了海量的數據需求,然而,在模型相對發展成熟後,通過繼續優化模型代碼帶來的業務效果提升有限。因此,優化訓練數據成為AI模型進一步大幅提升準確率的重要手段。
在這樣的背景下,企業Al研發越來越注重將資源投入到獲取高質量訓練數據的工作,而不只是模型訓練。IDC 調研發現,全球85%的受訪企業表示花費了超過一半的人工智能開發投入用於數據準備。
MatrixGo高精度數據標注平台
針對以上市場需求和痛點,MatrixGo高精度數據標注平台是澳鵬Appen在進入中國市場後結合海外實踐經驗,獨立自主開發的適配中國市場特性的平台產品。平台集成了豐富高效的標注工具、具備強大的工作流調度能力、通過對自有團隊、供應商團隊及百萬級眾包資源進行資源整合,可支持豐富場景海量數據的各種類型標注項目。
平台可通過私有化部署、SaaS服務、或混合雲部署方式交付,確保數據流轉合規,加強數據安全管控。平台將AI和模型能力有效地整合,以大規模人機協同的方式,支持海量數據採集、多語種多場景語音轉寫轉譯、3D點雲目標跟蹤和語義分割等功能,在各行業各領域為客戶提供高質量的AI訓練數據。
目前,澳鵬MatrixGo平台在2021年已經支撐和服務了中國130+客戶,700+個項目,完成了各種類型的AI應用的採集和標注服務的交付。
最佳實踐
1. 公司以智能語音技術為核心,對數據服務的需求類型中超過一半的需求屬於語音類數據采標服務,需求重點正在從成品數據集轉向方言、小語種等定制需求,應用於家居、車載、醫療和教育場景。與澳鵬的合作中,在數據采標服務的標準方面,溝通效率高、響應速度快、質量評估結果好。
2. 隨著業務場景拓展,公司對數據服務的需求增長加快,在內部標注團隊難以滿足業務需求的情況下,我們於2021年開始與澳鵬合作。合作的數據標注服務覆蓋NLP內容理解、AI助手語音識別、CV拍照影像等多個領域。澳鵬的業務覆蓋全面,可滿足各類業務需求,並在項目執行過程中,不斷針對新流程積極解決問題、提升項目交付質量。
IDC分析顯示,數據對AI的提升效果凸顯,在AI應用開發過程中,企業的關注點正在從模型轉向數據,需要更多的數據來幫助提升應用效果。另外,自動化正在成為數據服務的關鍵技術,可快速提升標注質量和效率。蓬勃發展的AI開發與應用正在為數據服務市場的發展帶來無限機遇。