數據化運營中玩過的分析項目
一個數據分析師的經驗總結
研究所畢業後,很意外的的混進了數據分析,又不知不覺的做了5年數據分析,可以說跟很多同事學到了不少東西,感謝他們無私的教給了我很多。
SQL從完全不會到隨手join五個表創建中間層;從簡單完成分析任務到全棧的思考,往後端思考代碼的嚴謹性、易讀性、可複用性;往前端思考業務指標的有效性、指向性、落地執行效果。
此文從整理了自己常用到/曾用過的方法有哪些,又有哪些還沒有應用到。
邀請你至Blog閱讀全文:
數據化運營中玩過的分析項目:一個數據分析師的經驗總結如果你喜歡我的文章,也邀請你訂閱『Rock Data』電子報,支持我持續創作
1.線性回歸分析
回歸分析是很常用的預測方法,我踏入職場第一個項目所用到的分析方法。
雖然此Model有一些限制,例如有不少前題假設,但他速度快、效率高且通俗易懂,仍是一個好用的方法。
2.RFM Model(分層模型)
對於用戶特徵分類的議題,大多會使用RFM、聚類分析跟決策樹。RFM模型雖然比較樸實無華,但還是一個很具影響力跟知名度的Model。
作為一個成熟的分析方法,完全可以應用到其他行業以及互聯網行業上,例如航空業的LRFMC模型就是對RFM模型的拓展。(我實際應用RFM model的場景可以參考之前的文章:電商小程序TOP100榜單怎麼來的)
3.關聯分析(交叉銷售模型/Apriori算法)
沃爾瑪著名的啤酒尿布模型,簡單說,就是只買了A商品的人,又有很多人買了B商品,那麼我們就可以認為A、B兩個商品的關聯性高。
但我認為這種結論很難發現,從直覺看,關連度高的都集中在同性質的商品。在產品種類不是非常多的情況下,使用更好懂的交叉分析,業務方的接受度更高。
舉個例子,對於買了A插件的商家,大多會配套買什麼插件?以此關聯,作為打包出售(組合購買)的依據。
4.留存分析
留存分析是一種用來分析用戶參與情況/活躍程度的分析模型,考查進行初始行為後的用戶中,有多少人會進行後續行為。是 AARRR 模型中重要的環節之一。
有時候我們光看日活(DAU),會覺得數據不錯,但有可能是因為近期有密集的推廣拉新活動,注入了大量的新用戶,但是留下來的用戶不一定在增長,只不過被新用戶數掩蓋了所以看不出來。
- Note1:其實我思考更在意,“時間區間的切割方式”及“觀察的天數要幾天”這兩個問題。對於遊戲這種週期性很短(或是說頻率很頻繁),關注每日留存很合理,但在轉換週期長的行業,或許3~7天、8~15天分組聚合會更好。另是觀察到近7天就好,還是要監控到30天?也是依據業務性質來判斷。
- Note2:上圖可以用SQL做兩層處理後直接出來,就不用取了raw_data後再去分析工具處理。
邀請你至Blog閱讀全文:
數據化運營中玩過的分析項目:一個數據分析師的經驗總結如果你喜歡我的文章,也邀請你訂閱『Rock Data』電子報,支持我持續創作
5.路徑分析:
此為互聯網與傳統行業在數據分析很重要的不同點,即用戶在互聯網的所有行為都會被記錄下來,形成海量的日誌數據。需要具備1.日誌佈點、2.日誌採集、3.日誌解析及4.日誌分析的基本知識。
主要有三種方法: (1)社會網路分析法、(2)基於序列的關聯分析及(3)最樸素遍歷法。這幾個算法目前都超過我的理解範圍所以也沒什麼可以說的。大多數的路徑分析,主流使用平台是Google Analysis(GA),據我了解其思路也是用遍歷思路。
- Note1:網站分析比較重要的KPI指標有瀏覽量、訪問量、獨立訪客數、跳出率(Bounce Rate)、離開率(Exit rate)、轉化率、頁面停留時間、訪問頁面數、流量來源等。(會困惑的通常是“跳出率”與“離開率”,兩者差別可以參考Google的說明)
- Note2:埋點跟日誌的知識真的有點難,想系統化的了解,有經驗的同學請推薦本好書來吧 :)
- Note3:之前整理過一些關於埋點的心得
6.漏斗模型
漏斗模型更專注在關鍵節點,關鍵節點轉化率太低通常意味著需要通過產品優化來改善用戶體驗,最終提升關鍵節點的轉化率。因此漏斗分析可被用於產品優化的重要參考。
從嚴格意義上來說,漏斗模型是包含在路徑分析中的,漏斗模型是路徑分析的特殊情況,是針對少數關鍵節點的路徑分析。
要注意的是,漏斗的路徑要唯一。曾經遇過”註冊 →填寫驗證碼 →填寫密碼 →創建帳號”的路徑不唯一,此時漏斗分析就無法適用。(但可以根據業務場景限制條件,保障唯一性)
7.數據可視化
這不是一個分析方法,但還是想抽出來提一下。以往都會有種心態,要做一些很厲害的分析方法,似乎認為這樣可以顯示很深度很厲害的分析。可視化只是用圖表展現而已,沒什技術含量。其實,這是錯誤的觀念。
首先,條條大路通羅馬,因為不同的思路之間普遍是聯繫的、不同的算法是普遍聯繫的、數據本身是普遍聯繫的。只要可以解決問題,就是最好的方法。
第二,很多公司都還處於掌握數據的程度,即便是互聯網產業,也可能業務線的多元發展,新業務還在初步發展階段,連運營狀況的基本數據都還沒掌握。對於一直要追蹤的數據,用分析方法會花掉太多時間,對分析師也是在做重複工作。
搭建儀表板做數據可視化可以解決這問題,要思考的方向圍繞在,要用什麼類型的圖表呈現?什麼指標可以清楚反應狀況?儀表板展示邏輯怎麼設計?
除了企業自行搭建的BI系統外,針對提供這種服務的軟體,目前較多使用的應該是Tableau、powerBI 、FineBI。
若要感受可視化的威力,推薦可以去Tablea public 看看大神搭建的儀表板,根本是藝術家的層級了。
8.分析的前置作業-數據處理
異常值/缺失值的處理、數據轉換(生成衍伸變量、改善分佈、數據標準化)、有效變量篩選、共線性
9.還是有不少分析方法尚未使用過
經過這樣整理後,發現還是有不少分析方法還沒用過或是只有淺層的接觸,包含流失預警、續約預測、聚類/神經網路/決策樹/支持向量機/羅輯回歸等分析方法。will…是一個要持續學習的行業呢…共勉之
邀請你至Blog閱讀全文:
數據化運營中玩過的分析項目:一個數據分析師的經驗總結如果你喜歡我的文章,也邀請你訂閱『Rock Data』電子報,支持我持續創作
1. Hello All:主站遷移至👉https://andyrockdata.com/ ,請改至『ROCK DATA』Blog 閱讀新文章完整內容,如果喜歡我的文章,可以訂閱我的電子報(Medium站仍將張貼新文章訊息)2.立即追蹤👉ROCK DATA臉書粉絲頁跟ROCK DATA IG(@andyrockdata)3.【入門數據分析,掌握HiveSQL取數能力】在hahow上架啦,購買連結👉 http://hahow.in/cr/andyrockhive4. 半佛系鼓掌:原來只要滑鼠一直按著不放就可以一直鼓掌了。那請你按久一點:)有任何想法或感興趣的地方歡迎留言/討論,或者私訊我!5. 往期的數據相關文章可以參考以下link
- 數據分析系列1:談談數據分析的眾多Title
- 數據分析系列2:數據分析的一週工作日程
- 數據分析系列3:身為資料分析師,你該如何展現工作中的價值?
- 數據分析系列4:如何量化職場規劃?我這次的轉職規劃與Offer選擇
- 數據分析系列5:為什麼要關心資料來源?談談埋點數據的陷阱
- 數據分析系列6:精選幾個機器學習的學習資源
- 數據分析系列7:數位化決策轉型與企業文化的一些思考
- 數據分析系列8:中山大學經濟所職涯座談(ㄧ):”了解自己”的重要&我怎麼成為數據分析師
- 數據分析系列9:中山大學經濟所職涯座談(二):想從事資料分析?你需要具備這8個能力
- 數據分析系列10:中山大學經濟所職涯座談(三) :讓資料變商機 — 資料分析在我們生活中的應用
- 數據分析系列11:面試時,資料分析師該怎麼準備作品集?
- 數據分析系列12:2018年終工作總結(數據分析師)
- 數據分析系列13:數據化運營中玩過的分析項目:一個數據分析師的經驗總結
- 數據分析系列14:如何提升運營/產品的優化效率?或許數據指標體系的搭建可以幫到忙
- 數據分析系列15:用戶畫像很重要,那你知道是怎麼畫出來的嗎?
- 數據分析系列16:給剛入行的數據分析師:想產生價值,在試用期要做的三件事
- 數據分析系列17:2019 數據分析工作總結_關鍵詞:數倉構建、BI可視化看板、用戶畫像(標籤)與精準行銷
- 數據分析系列18:入門數據分析的第一個大門檻:SQL/Hive取數-聊聊自身學習SQL的經歷以及三個自學網站分享
- 數據分析系列19:身為數據分析師,我怎麼看hahow上”R語言和商業分析”這門課
- 數據分析系列20:直接用SQL來分析數據?怎麼沒用python/R?3個面向來考量分析工具的選擇
- 數據分析系列21:數據分析的”橫向”學習之路-珍藏的網上文章重新整理放上github
- 數據分析系列22:透過埋點,讓數據說話:埋點基本知識
- 數據分析系列23:以數據為核心的CRM進化產品:帶你了解CDP(客戶數據平台)開發過程與難點
- 數據分析系列24:SQL不難啊,為什麼不容易精通?自學與實務的4個落差
- 數據分析系列25:數據分析基本-相關分析與可視化(R語言)
- 數據分析系列26:刷完了Leetcode SQL Hard Level的28道題:歡迎領取參考答案
- 數據分析系列27:數據太髒了!3個步驟做好數據質量管理
- 數據分析系列28:跨部門溝通成本太高?數據人實現高效跨部門溝通的4個方式
- 數據分析系列29:數據分析師職場發展的另類出路
- 數據分析系列30:Databrick為何收購BI產品Redash?產品視角來看Redash的功能與價值
- 數據分析系列31:數據分析師要失業了?解讀<2022 Gartner BI魔力象限> BI產品趨勢
- 數據分析系列32:Google Data Catalog如何幫忙管理數據? 產品介紹與體驗心得
- 數據分析系列33:復盤:數據產品從0到1的建設過程,我的9點感觸
- 數據分析系列34:Shopline-數據分析中心(Shoplytics)產品體驗
- 數據分析系列35:搞數據還是做產品?淺談『數據產品經理』