Search
  • Mercy Shao

數據驅動的新商業模式 動態生態系統及更緊密的利益團抱 (下)


新功能與新技術


與競爭對手合作以及與外部協作,是實現AI和數據價值無可避免的突破。然而,數據共享以滿足組織自身、合作夥伴、個人、社會並不容易,還要克服商業、聲譽和監管風險的考量。


在通過安全性,隱私權和代理機構建立信任的同時,如何使用數據滿足每個客戶的需求? 如何與他人合作,以從多個數據集中受益,同時保護合作夥伴、客戶等所有相關者的利益?

業務和運營模式應如何擴展,以符合不同的法規和政策要求?


為實現組織外部協作,企業多選擇不公開原始數據的情況下聯進行聯合分析和洞見共享,技術上以API和增強PETs(#PET)實踐。隨著歐盟一般資料保護規範(General Data Protection Regulation, #GDPR)和 加州消費者隱私保護法(California Consumer Privacy Act, #CCPA)生效,加上2020年7月16日撤銷的隱私盾協議(Privacy Shield agreement, #PrivacyShield ),在當前的監管環境中,數據共享更加困難。增強隱私以實現數據共享的做法,也成為新冠肺炎 #COVID-19解決方案和平衡公共健康政策的希望。PETs在員工透過科技創造價值的同時,使敏感信息保值機密及可追溯性,從而幫助企業在滿足法規的同時保持競爭優勢。新的數據管理模式,包含數據交換、協作和信任,除了個人數據儲存的聚合器,企業也致力使數據訪問民主化,數據服務商有能力保持數據隱私性及安全性,同時能夠作為服務提供給其他企業用以改善產品、服務及客戶體驗。


可信環境(Trusted Execution Environment, TEE)也稱為安全區域,是因一種基於硬體的環境,當前技術是使用芯片加密來處理數據,數據在運行時受到保護和隔離,不使用時,數據將被加密。例如Points使用基於TEE的機密計算框架,在不相互公開數據的情況下,數據所有者在計算任務和預測模型訓練方面進行協作。付款服務商使用PointS 允許銀行對其數據進行信用評分和銷售模型培訓。


分散式學習(Decentralized Learning)使用分佈在多位置的數據來訓練一個機器學習(Machine Learning, ML)模型,無須離開原始位置即可處理數據,當數據不在同一地點,分散式學習的技術可以在訓練機器的同時保護隱私。慧與科技(Hewlett Packard Enterprise, HPE) 的 Swarm Learning Library 就是一種分散式AI解決方案,使醫院或醫院網絡能夠完全遵守隱私法,安全地在全世界共享敏感的生物學數據,從而訓練可靠的ML模型,以快速可靠地檢測嚴重疾病,透過40個節點,根據自己的數據訓練ML模型,然後共享結果參數(但不共享數據本身)相互協作以共同訓練中心模型。Swarm Learning Library 已經在幫助識別白血病和急性肺結核患者。


分散式洞察力生成(Distributed Insight Generation),像分散學習一樣,訪問並分析的數據分散在多個位置。它依靠移動代碼並共享提取見解的演算法,而不是移動數據。開放演算法(The Open Algorithm, OPAL)是一個開放、安全並附有演算法的平台,可對位於防火牆後的合作夥伴公司的服務器進行數據處理,以提取關鍵洞察。它通過以保護隱私和可擴展的方式將代碼發送到基礎數據來工作。


多方計算 (Multi-Party Computation, MPC)是一種加密協議,可以對分佈式數據進行聯合計算而無需移動數據或使數據暴露在安全風險中,讓協作者可以分享見解和成果。Sedicii是一間愛爾蘭新創公司,使消費者能夠控制在線公司存儲的個人數據。Sedicii開發了使用MPC的協作式反洗錢監控平台,它使兩個或兩個以上銀行的網絡可以聯合和機密地計算風險評估算法,無需實際共享或公開客戶數據,從而針對多種類型的常見欺詐實時,安全,私密地對交易各方進行預篩查。


差異隱私(Differential Privacy)給數據或計算增加噪音或隨機性,隱藏細節並保護隱私權,同時允許公司收集和推斷統計信息。Apple, Uber, Facebook 和 Google 都在各個領域實施差異化隱私。在實用案例上,Facebook的Data for Good項目使用差異隱私技術匯總位置數據,以支持針對COVID-19和自然災害的響應工作。Google 通過可視化總體人口流動為減緩社會疏遠努力。同時,Google還啟動了開源差異隱私庫,以幫助小型企業、開發商和城市規劃人員。


差異隱私(Differential Privacy)允許在編碼時在其上運行計算,使公司可以利用第三方計算資源,例如基於雲的AI、高性能或量子計算,而無需擔心洩露敏感信息。同態加密是另一種技術支持第三方安全傳輸數據,並在加密狀態下處理。Duality Technologies與Dana-Farber癌症研究所和哈佛醫學院一起使用同態加密技術,對來自25,000多名個人的加密遺傳數據進行了大規模的全基因組關聯研究,其結果比其他隱私保護方法快30倍,這樣的分享技術得以支持更複雜的疾病分析。


個人線上數據儲存(Personal Online Data Stores, Pods)允許個人在保持控制權的同時儲存來自多來源的個人數據,用戶無須將數據集上傳到隔離公司,以提供不同服務,而是授予公司訪問 Pods上的權限。



數據分片(Data Sharding)是一種數據庫結構,將數據分解成各節點的分片當中。雖然不是一個新技術,但這樣的數據架構很大程度支持了運算資源優化。數據的分片當中不共享數據和計算資源,但據集再一起代表了數據集的邏輯。數據分片允許組織無縫擴展其數據庫,而不會增加其不斷增長的應用程序的複雜性。



圖一. MongoDB Sharded Cluster 基本的架構示意 (SOURCE: Soul & Shell Blog



數位孿生(Digital Twin)在2017-2019被資訊科技研究機構Gartner評為全球十大科技趨勢之一,是企業物聯網和數位戰略中相當重要的因素,Gartner預期到2022年,會有超過三分之二的IoT公司將在生產中部屬Digital Twin(進階閱讀:https://reurl.cc/v1dj2a)。Digital Twin完全或部分基於物理世界中數據的流程,產品或服務的虛擬模型。大數據系統MDClone使整個醫療保健生態系統中的數據民主化,並基於從真實人群中的統計資料建立一組虛構主題,但沒有任何一對一的聯繫。這使業務合作夥伴生態系統能夠訪問大數據來推動醫療保健創新,而不會損害患者的隱私和機密性。


可解釋且強大的AI,可以在支持企業決策過程當中,減少風險並建立社會信任。Fiddler Labs創建了一個AI引擎,透明化決策因素,因此開發人員、監管人員、企業和最終用戶可以更好地了解演算模型的工作方式,並根據需要進行修正。 許多組織,例如Immuta、Truepic,也在解決更廣泛的數據準確性問題。



商業新範式


現在企業的未來取決於有效使用數據,而數據使用意味著提高股東價值,以及基於新技術或新觀念建立新協作。首先,需要利益相關者授權。數據所驅動的價值,是建立在利益相關者的信任和可持續關係的基礎上,需要所有相關者體驗價值並做出承諾。現在,個人數據授權和處理尤為重要。舉例而言,在新冠肺炎危機中,若個人願意共享數據,並允許追蹤、診斷分析和提前尋求疫苗,有助於疫情控制。為新技術為公司提供了移動演算與新機會,但如何將相關者的利益崁入業務流程及營運流程中,是新技術落地的重要環節。


" 社會正處於臨界點,技術用短短幾個月走到了最前沿。這就產生了對增加包容性和減少不平等的期待。依賴數據的服務和產品是取得進展的關鍵,而利益相關者的參與和透明度將是增加信任的關鍵。 " Lynn St. Amour, President and Chief Executive Officer, Internet Matters; Member, Digital Economy Stewardship Board, World Economic Forum

其次是協作生態系統和夥伴關係。在先前的敘述當中提到了如何為生態系統開放平台,多個生態系統成員可以根據其獨特的位置和核心優勢來發現新機會與市場需求。越來越多公司發現,組織、合作夥伴、客戶和供應商擁有相鄰的數據和見解,如果與通過生態系統和平台進行結合,可以為所有人創造更豐富的價值主張。最後是可持續價值創造與系統變革。從積極面而言,新的協作方式能夠找出新機會和針對客戶需求分享成功,為企業和廣大消費者帶來積極的動態市場。然而,除了企業責任外,新的合作夥伴關係不受傳統行業價值鏈的限制,因此跨界夥伴關係對傳統價值池的侵蝕,也是新的挑戰。因此,這些正在探索新方法的領先企業,在各種角度的挑戰中,找出可採取的行動並建立範式,將能夠找出能夠永續的行動。