數據異常如何分析?

15天0基礎極速入門數據分析,掌握一套數據分析流程和方法,學完就能寫一份數據報告!了解一下>>

前面兩篇我們講了對比分析法和多維度拆解法,下面呢我們通過一個方法論和一個案例來具體講一下如何運用對比分析法和多維度拆解法處理數據異常。

要處理數據異常,我們要先知道什么是數據異常,首先要有數據,才能知道什么是“異?!?。

百度百科的解釋是:指非正常的,不同于平常的。比方如突然的漲,突如其來的跌。數據漲跌是我們在日常工作中,最容易被發現的現象,也是我們平時工作中要去分析的。

也就是說,平時數據沒有波動,也許我們不需要去分析,但是如果數據有漲或者跌我們都需要去查出原因的。

一、為什么漲和跌都要關注?

相信很多朋友跟我一樣,起初接觸到數據,我只關心跌,為什么昨天的數據跌了?并去分析其原因,也會關心漲,但并不關心為什么漲,就像買股票一樣,跌了痛心疾首,并分析原因,漲了滿心歡喜,后悔自己為什么不買入多一點兒。

在數據分析的過程中,我們不僅僅要關心跌,以便采取相應動作,減緩跌的趨勢,也更要關心漲,弄清楚漲的原因,并放大它,或者說是復制它!

在數據分析的過程中,一定要搞明白每一次數據漲跌的原因。

一、數據異動分析方法論

面對數據異常通常有五步:

(1)發現異常

就像你發現昨天數據跟往前不一樣,猛漲了還是猛跌了,通過觀測數據發現異常。

(2)確定問題

發現異常之后,我們要確定這個異常是不是一個問題,有多嚴重,這里呢我們可對按照第一篇講的對比分析法那篇文章里的方法,從時間維度上進行周同比、月同比或者是年同比。

(3)確定原因

用咱第二篇講的多維度拆解法,對于這個異常的指標從不同的維度去拆解,找出原因。

(4)針對性解決問題

找到原因之后,就是針對性的解決問題了,根據問題的原因,動用公司的相關資源,去解決這個問題。

(5)執行

最后呢,就是把解決方案執行出來,把這個異常數據真正的從異常到執行,完成一個閉環。

下面呢我們來結合一個案例,講一下這五步怎么走。

二、案例解析

舉個栗子:你近期入職了某互聯網公司,公司的業務方向是做陌生人社交的,在處理數據的過程中,你發現在你入職的前一天,數據是異常的,特別想分析出原因是什么?那如何操作?

下面咱們一起來按照上面的方法論進行分析吧:

第一步,發現問題:上面說了你已經發現某一天的數據異常了。

第二步,確定問題:數據跌了那么多,問題是不是很嚴重呢?往期有沒有這么大的浮動?我們來運用第一篇講的對比分析法來看看周同比等數據。

數據異常如何分析?

數據異常如何分析?

由上圖的周同比可以看出,往期是沒有這個問題的,那說明這是一個嚴重的個例,這表示這一天確實發生了什么。那下面咱們來用第二篇文章講到的多維度拆解法來確定原因。

第三步,確定原因:那是不是哪個省份出了問題呢?

下面我們按省份進行查看,看是不是某一些省份的數據出了問題,由下圖可以看出,這次數據的猛跌是全國范圍內的,基本上所有的省份都有下迭。這里咱排除了某個區域下跌的原因。

數據異常如何分析?

那是不是設備出問題了呢?

下面咱再來看不同操作系統的數據有什么不同,由下圖可以看出安卓和iOS在這天出現了下跌。所以,我們排除了設備出問題的情況。

數據異常如何分析?

那是不是服務掛了呢?咱們按小時或者分鐘來查看,看數據是不是符合平時流量規律?

數據異常如何分析?

通過上圖我們可以看出,在這一天的0:01分,平臺的數據為0,出現了斷崖式下跌,我們是一款陌生人社交產品,以往這個時候活躍用戶還是挺多的啊,由此可以看出,這一天的數據異常確實是因為服務掛了。

第四、五步就一起說啦,由上圖可以看出,服務掛了,相關負責人及時確定了問題,并針對性的解決了問題,且執行了下去,因為在零晨1點左右數據又恢復了正常。

以上5步看起來簡單,但是它是基于你對自己的業務要有所洞察的基礎之上的。你只有對自己的業務有所洞察,有以往的經驗,你才能做出這些判斷 。

如果對自己的業務不了解,給你再多的數據或者是工具,抑或是方法論,都是沒有用的。所以,建議大家把這個方法用到工作中,不斷的積累,不斷的驗證。

通過上面的案例解析,你有沒有發現,在確定問題時,咱們提了很多假設,往期有沒有這個問題?是不是哪個省份出了問題?是不是設備出了問題?

其實數據只是驗證咱們想法的支撐工具,首先需要有一個假設。

當然,就像前面所說,這些假設是基于你對業務了解的基礎之上的,在這個過程中,你需要不斷的去試錯,不斷的積累你的行業及業務的洞察,才能做出這些假設。

雖然說假設是基于對業務的積累,但還是有一些常見的假設的,如果你能掌握下面這幾種假設,通常能解決你工作中關于數據異動的大部分問題。

三、那常見的假設有哪些呢?

常見的假設有下面五種:

(1)活動影響:查對應活動頁面及對應動作的數據波動,關注活動是否有地域屬性。

通常咱們的市場或者運營會去做一些活動,所以如果數據出現問題,先看看PV、UV等數據,看是不是活動的影響。

(2)版本發布:將版本號作為維度,區分查看。

有時候數據出現異常也有可能是新版本的發布帶來的波動,所以咱們也可以把版本拎出來看,如果發布的是V1.5,我們可以對比著看看V1.3、V1.4這三個版本數據,看是否正常。

(3)渠道投放:查看渠道來源變化。

WEB端的渠道來源有很多很多,但是像APP就有點困難,這時咱們可以看看新增的渠道來源,來看看變化影響。

(4)策略調整:策略上線時間節點,區分前后關鍵指標波動

工作中我們會經常改變策略,比如說搜索策略,推薦策略等等,但是呢策略改變之后上線,它肯定有上線時間節點的,這時候咱們可以把這個時間節點像剛才講的案例那樣,拆分成分鐘來觀察。

(5)服務故障:明確故障時間,按時間維度進行小時或者分鐘級別進行拆分

通過上面的案例你也可以看出來,服務故障出問題是有一個明確時間的,按照上面案例講的方法來觀察,按分鐘來查看,看有沒有出現斷崖式下跌,這個時候咱們就可以明確是不是服務出現了故障。

好啦,數據異常如何分析這篇文章到這就完結啦,下面是本篇的思維導圖~

數據異常如何分析?

下篇文章咱們來講講第三個數據分析方法:漏斗分析法,歡迎繼續關注。

推薦閱讀

對比分析法

多維度拆解法

 

作者:菜菜,公眾號:菜菜嘮產品(caicailaochanpin),歡迎關注~

本文由 @菜菜 原創發布于人人都是產品經理,未經許可,禁止轉載。

題圖來自Unsplash,基于CC0協議。

給作者打賞,鼓勵TA抓緊創作!
評論
歡迎留言討論~!
福彩开奖直播去哪看