晶片的進步帶動了科技的發展,隨著物聯網的普及,我們如今面臨的數據其本質已和過往不同,值得思考的是在現在的數據世代,我們使用數據的方式
近年來,隨著數據的急遽增長,我們已邁入人工智能的崛起時代,「數據經濟」再次被高度重視,龐大的商業利益使得我們對於數據的價值更加重視。即便現今已進入以數據驅動的世代,在設備技術優化、時空背景的轉變下,數據的型態與本質已發生巨大轉變,但我們使用數據的方式是否也跟著改變了呢?
本篇主要希望可以先帶領大家一起談談過去的世代與數據轉變的歷程,通過這些資訊,我們能夠更加清楚了解過去與現今的世代差異,進而思考世代轉變所衍生出的數據問題。
以「計算」為中心的Compute centric世代 到 以「數據」為中心的Data centric世代
追朔到1970年代,積體電路技術的崛起使得電腦開發成本降低,普及化的潮流席捲各個家庭,迎接了電腦世代的來臨。然而,當時電腦記憶體容量有限,中央處理器(CPU)價格高昂且運算速度較為緩慢。
為了解決電腦計算資源有限的問題,在過去數十年裡,計算中心化是處理數據的主要方式,使數據集中在一個適合運算的位置處理分析,提高整體運算的效率,也就是以「計算」為中心的Compute centric世代。
每次要運算時,使用者必須把資料從硬碟內搬移至記憶體運算,再搬回硬碟,因此花費很多時間與成本在「搬移」這個過程之中。
隨著數據本質的轉變、晶片的優化加上物聯網拓展應用下,龐大的數據量已不再適合使用這樣的方式,改透過設備本身足夠的計算能力,即時處理數據問題,使我們從傳統的中央化的數據處理方式慢慢轉變成為以「數據」為中心的Data centric世代。
數據的轉變-物聯網時代與大數據
數據本質改變的契機源自於摩爾定律。
定律提出後的50年,半導體的發展有如當年預測的那樣,晶片越來越強大,價格也不斷降低,帶動數位科技的演進,讓我們快速進入到一個數據量巨大且計算能力強大的世代。
通訊設備與網際網路的普及促進了物聯網(IoT)的誕生,徹底改變數據的本質。晶片被廣泛運用在隨身的電子產品上,智慧型穿戴裝置的誕生開啟我們被無處不在的數據所環繞的生活。
物聯網的擴展使得我們被包圍在一個處處都是感測器的世界,進而產生源源不絕的數據,從個人軟體的使用或智慧城市的應用,數據量已經成長到基本上可以還原我們每一個人一整天的歷史軌跡。根據IDC所發布的《數據時代2025》報告顯示,2025年全球每天將產生491EB的數據量,以目前美國的平均網速為25Mb/秒而言,一個人要下載完一年所產生的數據量,至少需要18億年。
這麼大量的數據從哪裡來的呢?
可以想像一下,現代人越發依賴手機、平板、智能手錶等裝置,這些隨身攜帶的裝置中有著各種應用程式,隨時記錄著不同時間、地理位置產生的各種數據型態,包含:照片、文字、影片、數值等,透過廣泛覆蓋的網際網路,讓這些數據更加「即時」(接近即時)地被蒐集,進而改變過往數據的本質,成為了「巨量、多樣、快速」的存在。Live and Ubiquitous ,現在的數據是鮮活且無處不在的,就宛如有生命的活動著,也就是所謂的「活數據」。
數據的轉變對我們而言,是一種新的轉機。這些鮮活的數據能夠幫助我們更全面思考並推理合適的商業決策,但與此同時,如此複雜的即時數據,更需要具有專業背景與相應能力的專家來協助轉化成清晰的圖表,在這過程中我們也將面臨到新的挑戰。
Awareness 打開數據新思維
值得我們思考的是,在這個不論是數據的本質或是計算方式都已不同的世代裡,大多的使用者仍舊遵循著: 數據蒐集、清洗整理、儲存管理 (ETL)再到串接API的標準來處理數據。
然而我們察覺到的是,隨著數據本質的轉變,其價值性越來越高,人們就更加不願意提供自身的數據,即便願意提供數據,卻無法保證數據不會被做二次販售或惡意濫用,當沒有足夠保障的情況下,數據就可能被拷貝盜用。但是當數據之間無法有任何交集時,就形成一座座孤獨的島嶼,縱使島上礦物資源豐富,卻也難以發展出更加進步的文明與價值,這也恰恰是數據商業價值被低估的原因。
因此在最初的數據蒐集過程中,我們面臨到最大的挑戰就是「如何讓大家都願意在有保障的情況下願意拿出數據?」再來,我們將思考的是,整個數據處理的方式較為複雜,當我們邁入到大數據的時代時,這樣的方式是否會使我們付出更多的成本?
這些對新世代數據的疑問,成為我們的起心動念。
從打開封閉環境開始,我們希望建立開放的數據生態系,讓數據在被保護的狀態下能夠碰撞出新的商業機會,並且在不用整合的情況下,就能夠完成數據的交叉分析,降低數據使用的技術門檻,打造更加平民化的數據使用環境。正如同歷史中紙張的出現,讓知識、文化得以保存並傳播得更遠,在不知不覺中改變了人類行為與思考的模式。現今,品牌名稱Aralia取自當時造紙最為高級的蓪草紙的原料名稱,期許能夠打破現有的數據思維,開創嶄新的使用模式,建立更加廣闊的數據生態系。
🪐漫步星球🪐
除了上述的問題之外,你認為目前的數據使用上還面臨了哪些問題?
0 Comments