分析可以很簡單,但若想要針對巨量的數據進行分析,不僅考驗數據分析師對於Python, SQL資料庫等軟體操作,同時也考驗分析師對於產業的domain know-how的熟悉。

我們的日常生活中,「分析」其實相當普遍,每天我們都會運用簡單的數據分析來幫助我們決策。例如:比較不同交通工具與路段狀況後決定行程的路線,又或著是綜合考量價格、品質、評價等資訊後,選擇購買哪一品牌的產品。

然而,商業中使用的數據量遠比起生活中的更加龐大且複雜。每一個看似簡單的問題背後,其實可能涉及無數數據的相互關聯。若希望能夠從根本處獲得商業洞察並解決問題,就必須仰賴分析人員的協助,這也是為什麼數據分析看似簡單,但市場上的分析人員仍是供不應求。

圖片來源: Aralia,2024 年 06 月

數據分析人員的三大困難

如果你也想踏進分析領域,成為數據伙伴之一,那麼這篇文章將是不錯的參考之一。從事數據分析的工作需要具備許多的軟硬實力,而初學者在踏入該領域時經常會遇到以下三大挑戰。

1.不具備該領域的產業知識

分析人員在到手一個專案時,腦海中必須思考的兩大問題是:「我要解決什麼問題?」以及「為了解決這個問題我需要具備哪些數據?

這兩個問題的回答都十分仰賴分析人員是否具備相關的產業知識(Domain know-how)。產業知識涵蓋的範圍非常廣泛,只要是行業或是職業中的細節都算是產業知識的一環,包括但不限於產業的市場環境、產品銷售通路、產業法規等等。

假設老闆希望可以了解為什麼最近線上商店的銷售增長緩慢,而實體店與第三方平台銷售依然強勁的原因。在不了解零售產業通路的數據分析人員,可能僅考量到消費者購買行為、競爭動態、行銷成效等,而卻忽略了線上與線下的物流情況,導致未能正確判斷與解決問題。

另外一個則是將會影響到對於商業洞察的判斷。數據分析專案最終要產出是透過數據(Data)結合個人具備的產業知識(Domain know-how)所產生的商業洞察(Business Insights)。這些洞察見解最終需要回歸到各個部門進行實際的改善優化。

若不具備該產業的相關知識,最終在提出商業洞察時,也可能會無法識別問題根源、提出有效的假設,導致改善後沒有得到預期的成果,即便調整了策略,始終無法有效解決問題。

2.分析工具難以上手

數據分析人員通常需要處理巨量數據,因此需要許多工具來幫助處理與呈現數據,主要會區分為數據庫、程式語言與可視化報表三大類工具:

#數據庫:如SQL和NoSQL數據庫,用來處理資料的蒐集、清洗與轉換。

#程式語言:如Python和R語言,用於數據分析、計算關鍵指標,與利用機器學習建立模型,預測未來趨勢。

#可視化報表:如Power BI、Tableau,用於呈現最終的分析結果,並提出相對的商業洞察,與各個部門協作討論。

初學者經常會面臨市面上工具眾多,卻不知道該如何挑選的窘境,建議可以根據心儀的JD描述中,優先選擇學習工作上會使用到的工具,並將該項技能打磨得更加熟練。

圖片來源: Aralia,2024 年 06 月

3.獲取與準備數據

對於數據分析人員來說,數據就像是石油,沒有足夠的原料就難以使車子向前邁進。數據的蒐集是分析的基礎,初學者容易面臨的困境在於難以找到合適的數據來源。

除了公司內部的數據資料庫外,分析人員有時也會利用API和網路爬蟲的方式,在互聯網上獲取所需的數據資料,其他還有像是使用政府資料開放平台、Kaggle等網站,獲取整理好的開放資料作為輔助數據。

然而當好不容易從多個不同的平台和系統中,辛辛苦苦取得所需要的數據時,數據分析人員會面臨到的第二個挑戰就是,收集到的數據往往格式多樣、標準不一,可能還會出現缺失值、噪音等問題,吸引會需要大量的清洗整理等工作。

如何克服挑戰?

在這三大痛點中,相對容易的是硬實力的強化,從學習基本的語言到如何實際應用在專案上,市面上已有許多免費或付費的資源可供學習,能有效補強技術能力上的不足。

其次則是產業知識的累積,可以透過閱讀相關文獻、參與產業活動來累積,當然最好且最好掌握的資源還是來自觀察與請教內部的同事。

然而,最為困難的則是第三點,即外部數據的蒐集與取得。如何找到可靠的數據來源、建立有效的資料收集管道等,都是數據分析者面臨的挑戰之一。

儘管初學者在數據分析領域會遇到種種困難,但只要能夠清楚自己的目標與方向,懂得善用網路與身旁的資源,並持續精進自我、克服挑戰,都能夠在這個領域中有更出色的表現。

如果你也喜歡數據,歡迎追蹤我們的社群,一起來享受玩數據吧!
IG: https://www.instagram.com/araliadata/
FB: https://www.facebook.com/Araliadata