數據分析不是說一堆數字,而是探索數字背後的故事與可能

    數據分析,並不是看著數據報表的一堆數字,敘說著數字與數字的變化,或者報告數據的數值,這是沒有任何意義的。數據需要解讀,需要探索數字背後的意義。

 

Duolingo的社群數字

    就以這張圖為例,這是今天學習英文時看到的畫面,他給了我一些想法。

 

這張圖是Duolingo線上語言學習APP的社群關注數字,以Facebook來說,就是有多少人按他讚。

第一個logo是Twitter:有237,000人追蹤

第二個logo是Facebook:有1,280,000人按讚

第三個logo是Google+:有285,000人加入

 

    ok,就講Twitter和Facebook的數字,這兩個數字的懸殊性讓我有很多想法,如果單純只是說上面這三個數字,以及驚訝說,哇歐Facebook的人數是Twitter的5.4倍,這樣是毫無意意的,就算把他畫成長條圖、圓餅圖、甜甜圈圖又能說明什麼? 數字,仍然只是數字。

 

這個數據,當下讓我想到的是,為什麼Facebook和Twitter的數據如此懸殊?

  • 第一個聯想的反應是:Twitter和Facebook使用者數量是否有差距這麼大?可是歐美地區不是很愛用Twitter嗎?
  • 第二個聯想的反應是:會不會是Duolingo的使用者剛好也使用Facebook的人數比較多? 如果是這個原因,又是怎麼造成的?

 

    想要回答第一個問題,我google://twitter facebook,答案就出來了

Twitter與Facebook手機使用者人數線圖

Facebook與Twitter的手機使用者數量

 

Stratechery:How facebook squashed twitter

 

    如果是第二個原因,那為什麼會這樣?這時候就需要了解Duolingo的使用者全球分佈圖、學習語系數據,以及Facebook的使用者分佈,這個太複雜了,不想去查,只是簡單發想而已。

    但是呢,這時候可以有另外一個發想,如果是第二個原因,還可以再深入問,為什麼使用者會與Facebook的使用者重疊?地區性原因?語言學習系統的語系原因?或者其他原因?

    以此深入,可以思考接下來要如何推廣?用什麼方式推廣?或者是學習系統接下來要推出哪種語系?面對哪些人等等…

 

    這個只是簡單10分鐘不到的亂想,只是說明了數據解讀,不是看表面的數字,是要探詢背後的原因,依據背景know how,思考任何可能性並提出假設,驗證假設並延伸思考。

    最終,數據分析可以解答一些問題、提出行為建議、甚至輔助規劃發展藍圖

 

    網路時代之所以如此重視數據,是因為所有的一切都透過0與1傳遞,只要想要,就可以紀錄。相比以往傳統的商業模式或者分析工具,要取得資料需要透過各種調查手段,總是有取樣的問題,以及正確與否的考量;網路傳輸所採集到的數據質、與量都優於過去作法,這是最大的差別。