400-010-3808

收藏我(I)們

公司動态

Company Dynamics

伍強精品課堂:數據背後的(Of)邏輯
項目啓動時(Hour)間:2021-09-01
分享至:

        從事物流系統設計,物流園區規劃,首先就要(Want)進行數據分析,這(This)一(One)觀點逐漸爲(For)行業所接受。數據分析分析什麽,已經有專門的(Of)教科書進行講解,不(No)是本文的(Of)重點。本文重點是談數據背後的(Of)邏輯問題。

        對于(At)數據分析,大(Big)家普遍感到(Arrive)困惑的(Of)是分析的(Of)是否正确有用(Use)和(And)如何使用(Use),哪些數據是不(No)對的(Of)和(And)失真的(Of),哪些數據需要(Want)修正,哪些數據需要(Want)補充。對這(This)些問題的(Of)回答,核心問題是探讨數據背後的(Of)邏輯,理清數據關系,才能正本清源,數據分析的(Of)結果才有意義。

數據失真是一(One)種客觀存在(Exist)

        數據作(Do)爲(For)反映客觀世界的(Of)一(One)種方式,有時(Hour)會失真,從而使真實世界發生(Born)扭曲。失真的(Of)原因很多,主要(Want)有以(By)下幾種:其一(One)是數據記錄問題,數據記錄有記錯和(And)數據丢失,這(This)一(One)問題發生(Born)的(Of)可能性非常大(Big)。數據不(No)管是記錄在(Exist)何種載體上,由于(At)記錄手段問題,接口問題,傳感器問題,存儲媒介問題以(By)及環境問題,錯誤和(And)丢失在(Exist)所難免;其二是人(People)爲(For)造假,這(This)個(Indivual)更爲(For)普遍。造假是人(People)類不(No)可杜絕的(Of)一(One)個(Indivual)現象,每個(Indivual)時(Hour)期,每個(Indivual)國(Country)家,每個(Indivual)地方,每個(Indivual)角落都存在(Exist)。無論是處于(At)何種動機,造假的(Of)代價之一(One)就是使真實世界不(No)再真實,這(This)是十分令人(People)痛惜的(Of);其三是偶發數據,雖然可能是真實反映,但又非常态,或者是經過調整後的(Of)數據,并非第一(One)手數據。

        人(People)們有時(Hour)候調侃,曆史沒有真相。是指曆史上的(Of)很多事件,真真假假,其真相成爲(For)永遠的(Of)迷。這(This)裏既有曆史事件記載者的(Of)故意,也有以(By)訛傳訛的(Of)原因。有的(Of)真相很簡單,但如果當事人(People)或傳播者故意誤導,可能真相真的(Of)就成爲(For)曆史之謎,再也無人(People)知曉。

        現實中的(Of)實例也不(No)勝枚舉。比如國(Country)民經濟統計,看起來(Come)很簡單的(Of)一(One)件事,但實際就很難做到(Arrive)十分真實準确,有時(Hour)還相差甚遠。物流行業數據統計也是如此。我(I)們到(Arrive)現在(Exist)也沒有一(One)個(Indivual)權威的(Of)統計數據,告訴人(People)們每年的(Of)堆垛機的(Of)産量,輸送機的(Of)産量,分揀機的(Of)産量,貨架的(Of)産量等,都隻是一(One)個(Indivual)大(Big)概估計。

        總之,數據失真,既有技術原因,也有人(People)爲(For)因素,人(People)的(Of)因素又分爲(For)主觀故意、無心之失或能力所不(No)能及。這(This)是一(One)種客觀的(Of)存在(Exist),誰也改變不(No)了。

數據之間的(Of)邏輯關系

        面對一(One)個(Indivual)不(No)真實數據所描述的(Of)世界,人(People)們往往難以(By)分辨數據真假。其實,熟悉數據分析的(Of)人(People),一(One)般會從數據之間的(Of)邏輯關系中判斷出(Out)數據的(Of)可信程度。雖然我(I)們不(No)知道真相的(Of)具體細節,但通過邏輯分析和(And)比對,會基本還原真實世界大(Big)緻的(Of)情況。

        一(One)句謊話,往往要(Want)10句謊話去掩蓋。這(This)句俗語說明了一(One)個(Indivual)基本事實,就是事物之間是有千絲萬縷的(Of)聯系的(Of)。反映到(Arrive)數據,就是數據之間是具有邏輯關聯性的(Of)。這(This)一(One)事實爲(For)人(People)們甄别數據的(Of)真僞提供了參考和(And)方法,但有時(Hour)也不(No)是萬能的(Of)。

       對物流數據分析來(Come)說,年銷售額、箱單價、日收貨量、日發貨量、庫存量、退貨量、庫存周轉天數等這(This)幾個(Indivual)數據是互相影響的(Of),所以(By)我(I)們可以(By)從彼此的(Of)關系中,發現問題所在(Exist),可以(By)判斷數據是否真實可靠。

        特别是在(Exist)大(Big)數據時(Hour)代,對事物的(Of)真相判斷會更加準确。因爲(For)大(Big)數據會從多個(Indivual)角度去描述同一(One)件事情。比如一(One)家企業的(Of)運營狀況,可以(By)從員工人(People)數、營業額、收入、納稅額、工資、獎金、辦公開銷、投資、研發經費、宣傳費、差旅費、按月度計算的(Of)流水等多個(Indivual)維度進行分析,還可以(By)從行業平均利潤分析其利潤額合理性等。一(One)旦某些數據出(Out)現大(Big)的(Of)偏差,則可以(By)判斷其數據真實性值得懷疑。

        對一(One)個(Indivual)物流中心來(Come)說,很多數據之間具有強相關的(Of)邏輯性。比如銷售額與發貨量的(Of)匹配,輸送線的(Of)輸送能力與系統産能的(Of)匹配,庫存與銷售的(Of)匹配,發貨區、發貨月台與發貨量的(Of)匹配等,其中的(Of)邏輯關系其實并不(No)複雜。然而,對一(One)些用(Use)戶來(Come)說,并不(No)完全知曉這(This)些關系,從而對系統的(Of)能力産生(Born)認知上的(Of)錯誤。

        有了數據間的(Of)邏輯,就爲(For)我(I)們處理數據提供了參考。有些數據需要(Want)删除,有些需要(Want)修正,有些則需要(Want)補充。

數據的(Of)偶然性與必然性

        數學證明上有一(One)個(Indivual)非常重要(Want)的(Of)證明方法-反證法。即要(Want)證明一(One)個(Indivual)命題是否正确,隻要(Want)證明其反命題不(No)正确即可。而要(Want)證明一(One)個(Indivual)命題不(No)正确,則隻需舉例一(One)個(Indivual)反例即可。比如要(Want)證明是無理數,隻要(Want)證明其反命題,即是有理數這(This)個(Indivual)命題是錯誤的(Of)即可。這(This)一(One)方法對于(At)數據分析也是非常有用(Use)的(Of)。


        大(Big)千世界,變幻萬千。對數據分析者而言,識别數據的(Of)真僞是一(One)方面,而如何正确的(Of)分析,則是更爲(For)重要(Want)的(Of)方面。數據分析爲(For)我(I)們描述了一(One)個(Indivual)曆史現狀作(Do)爲(For)前提。因此,不(No)要(Want)站在(Exist)一(One)個(Indivual)錯誤的(Of)前提下,對未來(Come)進行預測,那樣會毫無意義,且非常危險。

        如何去僞存真,不(No)是一(One)件容易的(Of)事情,尤其對于(At)初學者而言。比如要(Want)如何篩選和(And)修正一(One)些曆史的(Of)數據,就是一(One)項複雜且繁瑣的(Of)工作(Do)。有些數據是客觀存在(Exist)的(Of),也是真實的(Of)反映,但卻不(No)具有普遍性,是一(One)種偶然,一(One)種異常。對這(This)些數據的(Of)處理,即要(Want)求對偶然和(And)必然的(Of)事件要(Want)有一(One)個(Indivual)分析和(And)判斷。

        我(I)們常常看到(Arrive),某一(One)天的(Of)物流數據非常異常,但卻是客觀存在(Exist)。比如某一(One)商品銷量很大(Big),或某一(One)天的(Of)發貨量很大(Big)等,就可能是因爲(For)某一(One)偶然事件所引起。而這(This)一(One)事件有時(Hour)并不(No)具備普遍性。有點類似于(At)電信号中的(Of)幹擾信号。對這(This)一(One)類數據的(Of)過濾和(And)修正是必要(Want)的(Of)。不(No)要(Want)一(One)葉障目,不(No)見泰山。

        另一(One)方面,也不(No)要(Want)輕易放過偶發事件背後的(Of)邏輯分析,有時(Hour)甚至會有意外的(Of)發現和(And)作(Do)用(Use)。如對“雙十一(One)”數據的(Of)分析,或對某一(One)網紅帶貨事件的(Of)分析等,就會指導物流設計在(Exist)面對此類現象時(Hour),如何有效處理。

        在(Exist)數據分析時(Hour),一(One)旦遇到(Arrive)特殊的(Of)數據,既不(No)能視而不(No)見,也不(No)能簡單的(Of)删除。而是要(Want)做進一(One)步的(Of)甄别。這(This)一(One)點考驗着分析師的(Of)敏銳和(And)耐心。

        有很多數學方法可以(By)用(Use)于(At)辨别偶然性和(And)必然性,過濾一(One)些幹擾數據。比如,爲(For)了避免算術平均值法給人(People)的(Of)一(One)種假象,可以(By)用(Use)階梯算術平均來(Come)修正,或采用(Use)均方差來(Come)評估數據分布的(Of)偏離程度。我(I)們在(Exist)統計個(Indivual)人(People)收入時(Hour),經常看到(Arrive)平均數有時(Hour)沒有多大(Big)意義,而階梯分析的(Of)數據更加容易看清楚數據的(Of)真相,如分析1%的(Of)高收入人(People)群,其對财富的(Of)占比等。階梯算術平均法在(Exist)分析物流數據時(Hour),很容易得到(Arrive)庫存和(And)發貨的(Of)ABC分布結果。更加深入細緻的(Of)分析,還可以(By)進一(One)步對标準差進行分析,從而有助于(At)确定設計指标。例如在(Exist)一(One)個(Indivual)物流中心的(Of)設計中,人(People)們常常需要(Want)一(One)個(Indivual)較合适的(Of)設計目标。這(This)一(One)目标的(Of)确定就跟标準差有關。最簡單的(Of)做法是,約70%天數的(Of)作(Do)業在(Exist)常規時(Hour)間完成,其它30%天數的(Of)作(Do)業通過加班完成,這(This)可能是一(One)個(Indivual)比較合理的(Of)尺度。

物流數據背後的(Of)邏輯

        在(Exist)實際應用(Use)中,抽樣統計在(Exist)統計中有非常大(Big)的(Of)作(Do)用(Use)。比如市場調查和(And)輿情調查,目前還基本采用(Use)這(This)一(One)方法。我(I)們在(Exist)物流作(Do)業中,往往也采用(Use)随機抽樣的(Of)方法,對産品質量進行評估。爲(For)什麽1%甚至更低的(Of)随機抽樣會大(Big)緻反映真實情況呢?這(This)就是概率論給我(I)們帶來(Come)的(Of)啓示。其實,我(I)們在(Exist)做物流數據分析時(Hour),随機抽樣仍然不(No)失爲(For)一(One)種有效的(Of)方法。

        對很多系統來(Come)說,數據反映的(Of)往往隻是表象。比如,人(People)們對于(At)一(One)個(Indivual)物流中心的(Of)評估,每年的(Of)發貨量反映的(Of)其實隻是一(One)個(Indivual)非常粗略的(Of)總數,背後隐藏的(Of)真相往往大(Big)相徑庭,兩個(Indivual)具有同樣發貨能力的(Of)物流中心,往往不(No)具有可比性。因爲(For)差異是多方面的(Of)。

1)工作(Do)時(Hour)間

        從大(Big)的(Of)方面講,工作(Do)時(Hour)間可能是單班、雙班和(And)三班,其差異已經是非常大(Big)的(Of)了。而進一(One)步分析,每個(Indivual)班次有的(Of)隻有4~5小時(Hour),有的(Of)會有9~10小時(Hour),差異也很大(Big)。有的(Of)年工作(Do)360天,有的(Of)隻有200多天。這(This)些差異,會導緻分析的(Of)結果出(Out)入很大(Big)。

2)單元貨物的(Of)價值

        單箱價格也是影響非常大(Big)的(Of)因素。物流系統能夠比較的(Of)是物流量而非銷售額。但往往被人(People)們忽視。就如同錯把物流費用(Use)與GDP做比較,不(No)考慮産業結構、地域、道路收費、工資等差異,從而得出(Out)我(I)國(Country)物流技術水平低的(Of)結論一(One)樣,其實是不(No)真實的(Of)。一(One)個(Indivual)以(By)日用(Use)、食品配送爲(For)主的(Of)配送中心,其單件價格隻有幾十元,而一(One)件藥品會高達上千元甚至幾千元,即使是同類商品,因爲(For)構成品質不(No)一(One)緻,産地不(No)一(One)樣,價格也會相差很大(Big)。比如進口産品和(And)國(Country)産的(Of)比較。

3)業務的(Of)均衡性

        有的(Of)配送中心,其業務波動性大(Big),随季節變化幅度非常大(Big),而有的(Of)會比較均勻。這(This)在(Exist)數據分析時(Hour)容易被忽視。但其影響巨大(Big),比如圖書與醫藥。圖書,尤其是教材教輔類圖書表現出(Out)明顯的(Of)季節性,而藥品的(Of)季節性影響就要(Want)低很多。如果再細分到(Arrive)每一(One)天,每一(One)周,每一(One)個(Indivual)月和(And)每一(One)季度的(Of)話,會得到(Arrive)非常驚人(People)的(Of)結果。如何均衡業務,其實對于(At)提升物流系統的(Of)處理能力有非常大(Big)的(Of)作(Do)用(Use)。這(This)就是物流反過來(Come)促進管理,促進市場的(Of)典型例子。與此類似的(Of)還有庫存周期和(And)庫存量,這(This)兩個(Indivual)指标其實決定了物流中心處理能力的(Of)天花闆,但又不(No)是物流系統本身所能解決的(Of)問題,必須要(Want)與采購策略進行聯動。總體來(Come)說,我(I)國(Country)很多行業的(Of)物流管理還是粗放的(Of),可以(By)優化的(Of)方面很多,而業務均衡性則是一(One)個(Indivual)有很大(Big)潛力的(Of)優化目标。

4)拆零比

        随着電子商務的(Of)興起,拆零作(Do)業在(Exist)物流配送中心的(Of)比重越來(Come)越大(Big),也嚴重影響了物流作(Do)業的(Of)效率。一(One)方面,人(People)們看到(Arrive)定制化帶來(Come)的(Of)服務提升,另一(One)方面,配送成本也随之大(Big)幅度提升。特别是最近幾年,圍繞拆零揀選的(Of)技術投入大(Big)幅度提升。面對這(This)一(One)現狀,對于(At)toB業務,是否可以(By)從提高整件配送比例出(Out)發,降低物流成本,成爲(For)一(One)個(Indivual)新的(Of)課題。即使對于(At)拆零揀選,如何采用(Use)單元化技術,使揀選更高效,其意義是多方面的(Of),未來(Come)肯定會成爲(For)企業關注的(Of)方向。

        除此之外,可比較的(Of)方面還有很多,如作(Do)業人(People)員的(Of)數量,設備的(Of)投入,自動化水平等,均影響物流配送中心的(Of)作(Do)業和(And)業績,有些還互相關聯和(And)影響。而這(This)些都是表面數據看不(No)到(Arrive)的(Of),或表現不(No)出(Out)來(Come)的(Of)。

        總之,數據分析不(No)是簡單的(Of)數據堆砌和(And)結果呈現,而是要(Want)挖掘其背後隐藏的(Of)真相。數據分析的(Of)價值在(Exist)于(At)發現數據背後的(Of)邏輯和(And)特征,找出(Out)普遍性和(And)規律性的(Of)東西,找出(Out)導緻問題發生(Born)的(Of)根本原因和(And)改進方向,從而指導未來(Come)進行的(Of)科學預測和(And)規劃。

部分圖片來(Come)源于(At)網絡

蜂鳥中台

立即前往 >

無憂服務

立即前往 >

行業方案

立即前往 >

聯系我(I)們

sales@vstrong.com

在(Exist)線服務

服務熱線

400-010-3808

TOP