增長模型下的產品與運營實戰 之一:數據體系運用(1)
在產品和運營的實踐中,數據是一切動作的依據和指引。作為互聯網產品和運營技戰術體系的第一篇,首先談談我對互聯網數據體系的解讀和使用。
就像人走路的時候需要看到前方的道路,產品和運營在做決策前也需要睜開“雙眼”。左眼,是數據;右眼,是用研。(哎,別問我為什么不是左眼用研,右眼數據。。。)通過線上數據反饋,可以準確地發現問題,找到規律,求證猜想,平息主觀之爭,為產品改進和運營優化的制定和實施提供明確的方向。
互聯網公司數據職能設置
互聯網公司普遍十分重視數據,數據部門職能設置卻各不相同。大多會設置獨立的BI部門(如攜程、京東),有些(如亞馬遜)也會把數據人員分散在各個團隊。
數據職能有三個主要角色:
數據工程師,負責搭建底層數據架構,定義數據埋點規范、編寫埋點代碼(有時也會由開發人員植入埋點代碼)、以及建立和管理數據庫報表。
BI,負責根據業務需求在數據庫中抓取對應數據項,編寫SQL代碼,生成各類報表。BI更類似于傳統的數據庫管理員(DBA)。
BA,負責對BI生成的報表進行分析,結合業務知識對數據進行透徹解讀,輸出有明確指導意義的觀察和建議。BA人員通常需要有較強的業務背景知識,能夠準確地理解數據背后的業務狀況和波動原因,并用業務“語言”輸出分析結論。
我在實踐中的體會是,兩種組織架構方式各有明顯的利弊,優缺點截然相反。當數據人員集中在一個部門時,數據庫管理和報表定制均十分專業高效。但因為離業務部門較遠,業務理解受到影響,在數據定義和解讀上相對偏薄弱。數據職能分散在各個業務線時則正好相反。并有較嚴重的數據重復拉取,人力浪費不說,還因口徑定義上的差異,導致同一數據在不同部門各不相同。例如轉化率=訂單數/訪客數,有的部門在訪客數中去除“疑似機器人”部分,有的部門則統一訪客數為“二跳訪客”,帶來轉化率數據的明顯差異。
一個比較好的做法是把數據工程師和BI集中在數據部門,在各個業務線分別設置BA人員,兩邊對接。
數據使用方式
互聯網需要進行數據觀察的領域十分廣泛,每個細分領域都有不同的核心KPI,應當根據核心目標拆分背后的影響因素,有針對性地提出數據需求,制定數據報表。
通常數據的使用方式分為如下情況,
常規數據報表主要用于需要長期持續觀察的核心數據。例如:
流量漏斗監控,可分為首頁跳失率、商詳頁到達率(分為瀏覽-商詳、搜索-商詳兩大分支)、加車率、結算率、結算完成率等核心環節漏斗數據。
用戶渠道來源情況,如各渠道來源的用戶數、新客數、訂單占比、轉化情況等等。
品類轉化率波動,如各品類的流量、訂單、SKU銷售數量等。
流量分發效率,如各頻道/欄目的CTR、商詳頁到達、轉化、復訪率等。
當常規監控的核心數據項發生超閾值波動或趨勢性波動時,通常會觸發專題分析,并根據分析結果采取相應對策,以推動數據回到常規范圍。
常規數據報表建議通過公司的BI系統定制在線報表,按監控頻度進行觀察分析。
專題數據分析通常按專題的主要影響因素確定數據項,拆分觀察維度,抓取多維度數據,對某個專題目標進行分析,找到影響因素所在的數據維度,得出結論,指導后續動作。例如:
針對某個重大事件的狀況或效果分析,如雙11大促后的數據總結盤點。
核心數據出現重大波動,如Web平臺轉化率持續提升的原因分析。
出現趨勢性狀況,如某付費渠道來源的用戶數量持續下降。
某個專題研究,如95后導購特征和消費特征分析。
產品經理常有的困惑是,當上線了某一個功能或者頻道后,目標數據出現了某種變化,然而,變化背后的影響因素非常多,例如時間因素導致的差異(如工作日的轉化率高于周末),競爭對手的動作,季節性因素等等。核心數據的波動往往是這些影響因素綜合作用的結果,很難準確界定該功能本身帶來了多少直接影響。
運營也常有類似的訴求,例如當首頁圖標做了飄紅,或者引導文案做了一些調整,數據出現了波動,但卻很難確定多大程度為該特定運營動作的效果。
上述情況下,最好的方法就是做AB測試:取兩個數據集,在數據集樣本的選取中對各種影響因素做均勻的隨機分布(如地域、用戶群體特性),并對其中一個數據集實施特定產品功能或運營動作,在同的一時段中,觀測目標數據在兩個測試集上的差異,從而精確判定待觀測功能/動作的準確效果。
這里要特別注意兩點:
1,為了確保統計效果的準確性,需要有較大的樣本量和統計時長(結果數量=用戶量*統計時長,要么用戶量足夠大,統計周期可以略短;如果用戶量較小,則需要更長的統計周期)。
2,如果某一個樣本中存在少數對均值影響巨大的樣本(例如一個金額巨大的訂單),需要予以排除,以減少偶然性帶來的偏差。
這是個大數據的時代,差異巨大的用戶群體面對海量的商品和選擇,“千人一面”帶來的糟糕體驗已不再適用。每個用戶在系統中都會留下自己的線索和足跡,體現自己在商品品類、價格段、品牌偏好等方面的階段性需求。系統可以通過數據有效發現當前用戶的當前需求,進行有效的推薦,而用戶也會感受到系統“懂我”,產生良好的購物體驗。亞馬遜早年的“Everything Store”理念,在當前時代下,也逐漸轉化為“Everyone Store”,也就是我們常說的“千人千面”。
數據是千人千面的基礎,通過機器學習和算法設計,讓系統在各個模塊中進行智能化推薦,自動組裝匹配當前用戶的場景,是數據使用的最重要方式之一。這部分我會在后續文章中結合實際案例重點展開。
數據體系運用的后幾篇文章中,我會逐一對常規數據報表、專題分析和AB測試,結合實際案例進行逐一闡述,敬請期待。
聲明:本站所有文章資源內容,如無特殊說明或標注,均為采集網絡資源。如若本站內容侵犯了原著者的合法權益,可聯系本站刪除。