現代數據生態系統面臨數據豐富但封閉的矛盾,限制了分析師有效決策的能力。建立開放數據生態系統,通過安全共享多元數據,能促進跨域分析和創新,實現數據供需平衡,並提升數據應用潛力,推動文明進步。
現代新矛盾:數據無限卻受限於封閉式系統
想像一個情境,你是一位食品製造商行銷部門的分析師,職責是分析千變萬化的市場因素及影響因子,協助配銷單位針對每日「要配送什麼商品(What)?到哪裡(Where)?多少量(How Many)?」做決策。你明白自己肩負著重要的責任,因為近年來,都會消費模式的迅速變化,以及線上和線下平台的相互作用,使得市場變得更加複雜。此外,競爭商品不斷湧入市場,讓你的工作更加挑戰艱巨,若僅藉由每週從自家零售通路收集銷售數據來做分析與決策是明顯不足的。
無奈的是,你需要考慮的變數繁多,如人口型態、居住環境、天氣、地震、交通、節日以及競爭者的新品與促銷等,每天都有新的因素不斷影響結果,這讓你感到頭痛不已。盤點完所需數據,在取得上除了開放數據(Open Data)外,有些數據甚至需要透過付費管道獲得,而無論是哪一種管道,數據在被正式使用之前需要一系列的清理、驗證和整合過程,你的主管希望幾天內就能知道答案,你卻花費了一週多的時間在進行數據的前置作業,距離正式分析和撰寫報告眼看遙遙無期。
在有限人力、時間與電腦資源的條件下,雖然你明明知道回答這樣的問題可以有更寬廣的思維來求解,而且你需要拿來比較的不同類型數據,其實也被政府、其他企業、學術機構等組織日複一日的紀錄著,並非不存在,然而在目前的數據生態體系下,即使分析師滿身本領,卻無法在有限的時間、資源與合法的途徑下收集、整合所需數據。
巧婦難為無米之炊,只能放棄了深入交叉分析及理解驗證市場需求的可能性,最後將就於組織內部的數據加上有限的外部數據做出分析報告,然而,故事的發展其實可以不是這樣的。
跨越組織疆界:多元數據碰撞產生綜效,彼此關聯分析
拜摩爾定律所賜,日新月異的製程技術讓科技用前所未有的方式改變了你我生活的世界,例如智慧穿戴裝置,時時刻刻偵測與記錄個人的健康數據,還能帶來便利的生活體驗,如搭捷運時用手錶支付車資;又例如智慧電網,時時刻刻偵測與收集使用端的電力使用狀況,來調節家電及企業使用者的耗電量,有效節約能源。這些便利的背後,充斥著一台一台聯網的行動裝置和感測器, 多元的數據(Diverse)因此源源不絕(Live)同時無所不在(Ubiquitous)地產生,在這樣快速發展的環境下,數據分析的問題應該不再是「如何蒐集數據?」,因為數據早就無時無刻被記錄著,問題是在於「如何快速找到有用的數據?」,也就是「數據的主人是否願意將手上的資源有效率地分享出來?」成為解決問題的關鍵,可惜在目前的數據存儲條件下,即便落花水面皆數據,但眾人始終無法跳脫壁壘分明的數據存取慣例。
數據屬於無形的智慧財產,卻不同於專利和商標,因為數據說到底就是一種被記錄下來的事實(Recorded Fact),任何人都可以針對一個現象和行為做紀錄。然而,隨著時間推移與空間(存儲設備)轉換,難以分辨這個紀錄出自於誰,因此人們難以認定數據所有權,而當數據一旦被分享,它就容易被複製、被佔有,數據的界線是如此模糊不清,以至於數據的主人會希望保護好手上的數據,不願意輕易分享給他人,因此出現了一個極度矛盾的狀態 — — 「當今的數據多元(Diverse)又源源不絕(Live),且無處不在(Ubiquitous),但卻存在於無數個數據孤島上」。
學術單位、企業組織、政府機關都分別擁有龐大且多面向的人類行為與環境數據,但卻彼此隔絕、缺乏共享的綜效,這種隔閡可能導致潛在的局限性,造成數據無法發揮其完全潛力,因為多元數據的互動就如同不同文化的碰撞一般,「文化碰撞」會產生有趣的人事物衝擊,造就一代一代的文化轉變與融合,甚至新文明的出現。而藉由「數據碰撞」釋放多元數據隱含的能量,找到跨域、跨界數據之間的關聯性,產生意想不到的洞察與創新。若能有一種開放式數據環境提供多元數據的交叉分析,我們便有機會看出更深入的因果脈絡,做出更適切的決策,甚至是產生跳脫原本想像的全新判斷。
開放式數據新時代:數據供需如同生態圈一般達成平衡
數據孤島限制了數據的應用潛力,這個現狀令人遺憾但並非無法突破,事實上,過往人類的歷史中就經歷了四次的數據革新,從遠古時期,當時的人類利用手邊能撿拾的骨頭或貝殼,將生活的細節刻畫在石壁上;隨著紙張和印刷術的誕生,有助資訊能更有效率地被傳遞與交流;隨著科技持續發展,電腦時代來臨,當時的數據聚焦在應用系統存儲的交易型數據(Transactional Data),所收集的數據範圍較為單一;最後進入當前的事實數據階段,IoT 互聯網以各樣的微型感測器將無數的行為與狀態數據無盡的被產生與被記錄著,新誕生的數據明明有機會如同河流一般源源不絕地匯聚數據大海,創造出更多新的綜效與發展契機,但使用者的思維和習慣仍然停留在上一階段,導致了數據長成了互不相連的島嶼。
然而革新只是尚未開始,並非不會到來,我們能否將座落四處的數據孤島轉化為生態圈,使其中的多元數據進行碰撞呢?是時候讓科技帶動人類思考與行為上的範式轉移(Paradigm Shift)了,透過將數據進行封包(Capsulated)取代原先的數位檔案(File)形式,讓資訊和洞察能以安全的型態進行分享與傳遞,數據在生態圈中進行跨域跨界的深入交叉分析,這取代了過往需要獲取原始數據才能進行分析的方法,保障了數據提供者的數據擁有權(Data Ownership),從而提升數據主人願意釋出數據的意願,提高供給,數據需求者也能依循簡單效率的機制使用多元(Diverse)又源源不絕(Live)、且無處不在(Ubiquitous)的數據。當這樣開放式的數據生態系統(Open Data Ecosystem)被興建,背後的安全與隱私機制被規範好,數據的供給與需求就有機會如生態圈一般自然而然地達成平衡,數據從孤島進化成生機盎然的數據星球(Data Planet),人類的文明階段也能達到下一個里程碑。
如果你也喜歡數據,歡迎追蹤我們的社群,一起來享受玩數據吧!
IG: https://www.instagram.com/araliadata/
FB: https://www.facebook.com/Araliadata