除了耳熟能詳的人工智能、機械學習、ChatGPT 之外,數據倉庫、數據市集、數據湖泊、數據經緯(Data Fabric)亦是科技界的「潮語」。對企業而言,這些技術似乎都是能逆轉業務的「神器」,但三軍未動,糧草先行,數據才是一切的根基:如何收集、整合、分類、組織、驗證和呈現數據,是企業需要考慮的問題。
數據是數碼轉型和人工智能發展的基石。在開始從數據投資中實現價值之前,組織花費大量資源構建複雜的數據整合、自定義分析引擎以及生成式 AI 與自然語言處理(NLP)模型。數據是企業最有價值的資產之一,可以包含有關供應鏈、財務預測、人力資源記錄、全通道零售等的關鍵信息。最近SAP 與Google Cloud 宣佈最新合作關係,SAP Datasphere可將來自SAP 和非 SAP數據源的數據組合到 Google Cloud 上,使組織的數據基礎能夠充份界定以保留完整的商業環境,加速數碼轉型。
此次合作源於市場上企業的需要。企業搜集的數據越多,就越需要完整的系統來整理、分類及利用數據。假如源頭數據不一致,缺乏單一的事實來源,便會產生「垃圾進,垃圾出(Garbage in, garbage out)」的情況,使企業難以從中提取商業洞見。隨著科技進一步重塑商業世界,明智的商業決策應由數據驅動,而非單憑主觀直覺。
既然如此,企業該如何整合包括外部和非結構化的數據,從而信賴數據,更有效地分享洞見呢?企業可藉著分析來識別數據的問題所在,但這充其量只是一枚反映情況的鏡子,而非解決問題的方案。數據源於環繞業務流程的操作系統,擁有良好管治的組織可擁有良好數據,但業務環境瞬息萬變,如何處理解決數據相關的問題已成為關鍵任務。
要展開第一步,首先要使用適當工具從小處入手。許多企業會將問題分為兩部分:「分析」和「數據管理 / 倉庫」。兩者目標一致,且互相補足。
解決問題並沒有靈丹妙藥,需循序漸進應對。在過程中,企業需不同工具以應對不同的數據挑戰。
- 如何組織數據:使用端對端方案,並考慮以單一平台統一數據及分析服務。企業可藉此獲取完整端對端且具意義的視野,當中包括數據管理、數據庫/ 數據湖泊和分析功能。然後,企業可考慮添加更多功能,包括數據目錄,以及用於模型開發的機械學習函式庫。
- 如何連接:連接和收集所有來源的數據涉及第三方方案,以在雲端及在地的環境把數據虛擬化、整合、複製和協調。同時亦應為數據供應者和消費者管理可延伸及分散的數據交互,並匹配不完善數據集供企業使用。
- 如何提升速度:只嵌入高性能的記憶體資料庫,並以動態數據管理提供支援。方案應能整合第三方數據庫 / 數據湖,同時與 SAP Datasphere 等方案在單一環境中協調。
隨著經濟開始復甦,企業是時候釋放商業數據的力量。不要讓數據閒置在數據庫中無所事事,而是要加以利用,改善決策。如此一來,數據便可轉化成競爭優勢,蛻變成商業洞察。
作者:SAP 大中華地區平台與技術卓越中心業務發展總監 Greg Wong