收藏我(I)們
Industry Information
第22屆足球世界杯已落下帷幕,這(This)一(One)屆世界杯最大(Big)的(Of)赢家是阿根廷,是梅西,更是億萬期盼梅西封神的(Of)球迷。将近一(One)個(Indivual)月的(Of)比賽跌宕起伏、精彩紛呈。球賽開始前和(And)比賽期間,預測結果更是成爲(For)球迷們的(Of)最大(Big)興趣。世界上的(Of)各大(Big)媒體,電視台,也紛紛加入到(Arrive)預測中來(Come)。我(I)雖然算不(No)上一(One)個(Indivual)具有專業水準的(Of)球迷,但也禁不(No)住周邊朋友們熱鬧場面的(Of)誘惑,對多場比賽結果進行預測。
預測的(Of)最大(Big)樂趣是增加了看球的(Of)樂趣,本來(Come)是一(One)場與自己無關的(Of)比賽,因爲(For)有了預測,就特别期望自己預測正确。而且一(One)旦結果與預測一(One)緻,那種成功的(Of)喜悅,很難用(Use)語言來(Come)形容。
預測足球比賽結果是一(One)門技術活,首先要(Want)對球隊有比較深入的(Of)了解,包括球員構成、綜合能力、曆史戰績、世界排名、當家球星、球員狀态、對手情況等,了解越多,預測似乎就越準确。但實際情況往往出(Out)乎意料甚至大(Big)相徑庭。以(By)牛津大(Big)學預測爲(For)例,他(He)們用(Use)自己的(Of)數學模型計算出(Out)來(Come)的(Of)預測結果如圖1所示。
圖1 牛津大(Big)學給出(Out)的(Of)預測模型
從圖1可以(By)看出(Out),盡管引入了非常複雜的(Of)數學計算,并對各隊的(Of)曆史數據,交戰結果做了詳細的(Of)分析,但預測結果卻不(No)盡人(People)意。小組賽也就有一(One)半預測對了勝負,其中進入決賽的(Of)兩支隊伍都錯了。其他(He)很多預測機構也大(Big)緻相同。
其實,影響比賽結果的(Of)因素很多,球隊實力固然非常重要(Want),但進入32強的(Of)球隊大(Big)部分實力都不(No)弱,尤其是進入淘汰賽階段更是如此。這(This)時(Hour)候,球隊的(Of)戰術安排,球員臨場狀态、取勝欲望、團隊配合等方面就顯得尤爲(For)重要(Want)。此外,運氣也是比賽的(Of)一(One)部分,并且往往成爲(For)左右比賽結果的(Of)非常重要(Want)的(Of)因素。
足球比賽既考驗雙方的(Of)能力,也是對雙方隊員面對面比拼時(Hour)心理素質的(Of)檢驗。盡管結果不(No)可預知,但其中卻蘊含有嚴謹的(Of)數學原理。今天我(I)們就談談這(This)個(Indivual)問題。
大(Big)家知道,概率論是解決我(I)們日常生(Born)活很多問題的(Of)重要(Want)數學理論。越來(Come)越多的(Of)足球預測,都是以(By)概率論作(Do)爲(For)基礎進行的(Of)。上述牛津大(Big)學的(Of)預測也是基于(At)概率論的(Of)。但概率論如何運用(Use),卻是有很多講究。
一(One)般來(Come)說,在(Exist)一(One)個(Indivual)非受限空間,一(One)個(Indivual)獨立事件發生(Born)的(Of)概率總是符合正态分布的(Of)。其定義是:若随機變量X服從一(One)個(Indivual)位置參數爲(For)μ、尺度參數爲(For)σ 的(Of)概率分布,且其概率密度函數爲(For):
則這(This)個(Indivual)随機變量就稱爲(For)正态随機變量,正态随機變量服從的(Of)分布就稱爲(For)正态分布,記作(Do)X~N(μ,σ2),讀作(Do)X服從N(μ,σ2),或X服從正态分布。圖2是正态分布分布密度函數曲線圖。
圖2 正态分布函數曲線(來(Come)源于(At)網絡)
當實際發生(Born)概率很小時(Hour),我(I)們稱其爲(For)小概率事件,從标準概率分布圖中可以(By)看出(Out),位于(At)區間(-3σ,3σ)以(By)外的(Of)概率小于(At)0.2%。所以(By),在(Exist)很多場合下,就不(No)予考慮。比如,我(I)們在(Exist)物流系統中采用(Use)稱重法來(Come)檢驗圖書揀選的(Of)準确性時(Hour),就是選取了這(This)一(One)标準。在(Exist)很多工業場合,标準會進一(One)步提高,比如我(I)們常說的(Of)6σ檢驗标準,就要(Want)求達到(Arrive)(-4.5σ,4.5σ)範圍,其精确度将達到(Arrive)3.44ppm(即百萬分之三點四四)。
再回過頭來(Come)看世界杯。如何運用(Use)數學原理進行比賽的(Of)預測呢?這(This)是一(One)個(Indivual)比較複雜的(Of)問題。如果單就一(One)場球來(Come)看,其實就是實力對比說了算,作(Do)爲(For)一(One)個(Indivual)獨立事件,沒有參考數據,很難做出(Out)準确預測。比如德國(Country)對日本,一(One)般情況下,大(Big)家預測都認爲(For)日本會輸。但是要(Want)進一(One)步定義輸的(Of)概率和(And)輸的(Of)比分,就比較複雜了。這(This)就牽涉到(Arrive)一(One)個(Indivual)概率問題。比如說德國(Country)輸的(Of)概率,其實我(I)們可以(By)讓他(He)們踢1000場球,看看比分會如何分布,這(This)樣結果就出(Out)來(Come)了。但實際上做不(No)到(Arrive)。因爲(For)即使集中踢1000場,這(This)個(Indivual)結果也是有問題的(Of),它與我(I)們擲1000次硬币的(Of)情況有很大(Big)不(No)同。因爲(For)比賽受到(Arrive)人(People)爲(For)的(Of)幹擾。其結果與自然發生(Born)的(Of)有出(Out)入。而實際上,集中踢1000場在(Exist)時(Hour)間上也沒有可能。所以(By),我(I)們在(Exist)預測一(One)場球時(Hour),就顯得很困難,事實上因爲(For)事件的(Of)随機性而變得無法預測。如果我(I)們假設德國(Country)和(And)日本踢1000場球的(Of)結果是600勝,300平,100負,這(This)一(One)結果對指導預測其實幫助不(No)大(Big),但如果聯系到(Arrive)曆史的(Of)比賽,我(I)們還是會做出(Out)比較可信的(Of)預測。另一(One)方面,我(I)們把一(One)場球放到(Arrive)一(One)個(Indivual)系統中看,将會又是一(One)番景象。比如我(I)們将德國(Country)對日本比賽放到(Arrive)一(One)個(Indivual)大(Big)的(Of)空間,如世界杯大(Big)賽這(This)個(Indivual)環境看,德國(Country)屬于(At)第一(One)梯隊,日本屬于(At)第三梯隊,這(This)樣看的(Of)樣本空間就大(Big)得多。因爲(For)有大(Big)量的(Of)第一(One)梯隊與第三梯隊比賽的(Of)樣本可供參考。我(I)們可以(By)從這(This)些曆史樣本中得出(Out)一(One)些有用(Use)的(Of)結論,如雙方曆史上的(Of)勝率,本屆已經完成的(Of)比賽的(Of)情況等,從而指導預測的(Of)結果。
在(Exist)小組賽期間,我(I)們知道,每個(Indivual)小組内的(Of)強弱還是比較分明的(Of)。這(This)樣大(Big)家的(Of)預測總體來(Come)說準确性要(Want)高一(One)些,這(This)是我(I)們應用(Use)概率論的(Of)基礎。但另一(One)方面,我(I)們也要(Want)看到(Arrive),比賽結果還是有一(One)定比例的(Of)場次出(Out)乎大(Big)家的(Of)意料之外。比如亞洲球隊的(Of)爆發,日本連勝德國(Country)和(And)西班牙,使得德國(Country)最終小組未能出(Out)線。開始時(Hour),很多中國(Country)球迷擔心亞太區球隊會被剃光頭,但事實上,不(No)僅有3支球隊(含澳大(Big)利亞)順利出(Out)線,而且每支球隊都有上佳表現。對此,我(I)開始就大(Big)膽提出(Out)兩個(Indivual)假設:第一(One)是亞洲球隊必定會有球隊進入第二輪;第二是比賽必定會有冷門産生(Born)。通過對各小組進行分析,首先把出(Out)線的(Of)球隊寄托在(Exist)日本、韓國(Country)身上,并将日本對德國(Country)、韓國(Country)對西班牙、沙特對阿根廷三場比賽定義爲(For)最容易爆冷的(Of)比賽。其中之所以(By)定義沙特對阿根廷會爆冷,則基于(At)阿根廷是奪冠大(Big)熱門的(Of)假設,并且其此前已經35場不(No)敗的(Of)記錄,已經平了世界紀錄。概率論的(Of)理念就是:阿根廷即使要(Want)破世界紀錄,也隻會破一(One)點點(小概率事件),也就 是說最多再赢1~2場;阿根廷要(Want)想奪冠,就不(No)能在(Exist)淘汰賽輸球,小組賽輸球是其唯一(One)機會。因此,其輸給沙特的(Of)理由最充分(第一(One)場可能性最大(Big))。比賽的(Of)結果印證了這(This)一(One)猜想。
到(Arrive)了淘汰賽階段,大(Big)家對預測英國(Country)和(And)法國(Country)比賽産生(Born)分歧。認爲(For)兩隊水平相當,英國(Country)更勝一(One)籌。但實際過程看,是英國(Country)幾乎沒有希望。但既然是預測,邏輯上要(Want)有一(One)緻性才行。很多機構預測法國(Country)和(And)巴西争奪冠軍,這(This)是有一(One)定道理的(Of),事實上要(Want)做到(Arrive)這(This)一(One)點,兩隊在(Exist)淘汰賽中,它幾乎就不(No)可能會輸。要(Want)怎麽樣才會輸呢?需要(Want)爆冷才會輸。我(I)們知道,在(Exist)世界杯上,爆冷是有其必然性的(Of)。從曆史數據看,總會有一(One)定比例的(Of)比賽會爆冷,有些還是大(Big)冷門,這(This)就不(No)是小概率事件了。法國(Country)輸給英國(Country)根本就不(No)算冷門,法國(Country)隻有輸給像澳大(Big)利亞這(This)樣的(Of)隊伍才是大(Big)冷門。另一(One)邊就不(No)同了,巴西對克羅地亞,結果是巴西爆冷出(Out)局;西班牙對摩洛哥,同樣是西班牙爆冷出(Out)局;到(Arrive)了葡萄牙對摩洛哥,其實已經不(No)是爆冷了,葡萄牙隊内出(Out)現嚴重問題,才使得摩洛哥一(One)舉擊敗葡萄牙,挺進4強。
其實,後面的(Of)4場比賽,結果早就失去懸念。盡管他(He)們的(Of)能力差異在(Exist)毫厘之間,但再爆冷的(Of)幾率已經很低了。其一(One)是克羅地亞和(And)法國(Country)進入決賽,這(This)幾乎是不(No)可能的(Of)結果,因爲(For)這(This)種重複上屆比賽結果的(Of)可能性微乎其微,曆史上隻有一(One)次,而且克羅地亞水平本來(Come)就有限,打敗巴西,進入4強已經是超水平發揮。其二是梅西封王衆望所歸,4次沖擊冠軍,無果而終,本屆比賽,将是梅西最後的(Of)機會。梅西占盡了天時(Hour)地利人(People)和(And)。人(People)們無法想象沒有獲得世界杯的(Of)梅西,會如何與其球王身份相匹配。第三是法國(Country)衛冕也是難上加難。試問,世界上除了巴西衛冕成功過一(One)次外,還有誰能獲得這(This)份殊榮?以(By)法國(Country)足球的(Of)底蘊,根本不(No)可能達到(Arrive)這(This)一(One)高度。
所以(By),同樣是概率論的(Of)應用(Use),在(Exist)臨場操作(Do)時(Hour)應該從多方面考慮,而不(No)能僅僅局限于(At)一(One)個(Indivual)維度。比如,預測決賽會不(No)會出(Out)現帽子戲法這(This)一(One)事件,有幾個(Indivual)因素支持這(This)一(One)預測,第一(One)是全部21屆比賽,居然出(Out)現了52個(Indivual)帽子戲法,平均每屆2.47個(Indivual),本屆比賽還隻有1個(Indivual),這(This)是不(No)正常的(Of);第二,從決賽的(Of)氛圍來(Come)看,從兩隊的(Of)風格來(Come)看,從球星的(Of)能力和(And)機會看,完全是有可能的(Of),并且可能是大(Big)概率事件。
世界上的(Of)事情,往往都包含有一(One)定的(Of)數學原理,被數學原理所制約。但即使如此,由于(At)未來(Come)的(Of)不(No)确定性仍然使得預測不(No)可能百分之百準确,預測歸根到(Arrive)底是一(One)種猜測,它不(No)代表結果的(Of)确定性。我(I)們知道,再小的(Of)概率也是可能發生(Born)的(Of),但如果我(I)們明白背後的(Of)邏輯,将會使得猜測準确性更高。足球比賽尤其如此。因爲(For),每場比賽雖然時(Hour)間很長,但進攻到(Arrive)禁區并且獲得得分的(Of)機會卻不(No)多。所謂的(Of)偶然性就成爲(For)左右比賽結果的(Of)重要(Want)因素。強隊如果沒有抓住機會,反而被弱隊抓住寶貴的(Of)機會,結果就會逆轉,這(This)也是足球最具有魅力的(Of)地方。當然,強弱如果是一(One)邊倒的(Of)情況,所謂的(Of)偶然性基本是不(No)可能發生(Born)的(Of)。
圖片來(Come)源于(At)網絡
上一(One)篇:伍強課堂:“工業貨架設計計算”标準解讀
下一(One)篇:要(Want)警惕放開後的(Of)新問題