關於切比雪夫不等式和中心極限定理的 13 個事實

在概率論中 切比雪夫不等式 & 中心極限定理處理我們想在近似正態條件下找到大量隨機變量之和的概率分佈的情況,在查看極限定理之前,我們看到了一些不等式,它提供了概率的界限,如果均值和方差已知。

馬爾可夫不等式

對於 a>0 只取正值的隨機變量 X 的馬爾可夫不等式是

證明這一點 a>0 考慮

現在考慮這種不平等,我們得到

原因是

這給出了 a>0 的馬爾可夫不等式為

切比雪夫不等式

 對於有限的 隨機變量 X 的均值和方差切比雪夫不等式 對於 k>0 是

其中 sigma 和 mu 代表隨機變量的方差和均值,為了證明這一點,我們使用 馬爾可夫不等式 作為非負隨機變量

對於 a 作為常數平方的值,因此

這個方程等價於

一樣清楚

馬爾可夫和切比雪夫不等式的例子:

  1. 如果將特定項目的產量作為平均為 50 的一周的隨機變量,求出一周內產量超過 75 的概率,如果一周的產量在 40 到 60 之間,則該概率是多少,並提供方差周是 25 嗎?

解決方案:考慮該項目生產一周的隨機變量 X,然後找到我們將使用的生產超過 75 的概率 馬爾可夫不等式 as

現在我們將使用方差為 40 的生產概率在 60 到 25 之間 切比雪夫不等式 as

so

如果產量在 40 到 60 之間,這顯示了一周的概率是 3/4。

2. 證明 切比雪夫不等式 它提供的概率上限並不是特別接近概率的實際值。

解決方案:

考慮隨機變量 X 在區間 (5) 上均勻分佈,均值為 25,方差為 3/0,1,然後由 切比雪夫不等式 我們可以寫

但實際概率將是

如果我們將隨機變量 X 視為具有均值和方差的正態分佈,那麼這與實際概率相差甚遠 切比雪夫不等式

但實際概率是

弱大數定律

隨機變量序列的弱定律將遵循以下結果: 切比雪夫不等式 可以用作證明的工具,例如證明

如果方差為零,則只有方差等於 0 的隨機變量是那些以概率 1 保持不變的變量,因此通過 切比雪夫不等式 對於 n 大於或等於 1

as

由概率的連續性

這證明了結果。

為了證明這一點,我們假設序列中每個隨機變量的方差也是有限的,因此期望和方差

現在從 切比雪夫不等式 概率的上限為

對於趨於無窮大的 n 將是

中心極限定理

中心極限定理 是概率論中的重要結果之一,因為它給出了近似正態的大數之和的分佈 分配 除了尋找獨立隨機變量之和的近似概率的方法外,中心極限定理還表明,許多自然種群的經驗頻率呈現鐘形均值正態曲線,在詳細解釋該定理之前,我們使用結果

“如果隨機變量序列 Z1,Z2,…… 具有分佈函數和矩生成函數為 FZn 和Mzn 然後

中心極限定理: 對於同分佈且獨立的隨機變量 X 的序列1,X2,……。 每個都具有平均值 μ 和 方差 σ2 然後是和的分佈

趨向於標準正態,因為 n 趨向於無窮大,因為 a 是實數值

證明:為了證明結果,將均值視為零,方差為一,即 μ=0 & σ2=1 和 力矩生成函數 對於Xi 存在且有限值,所以隨機變量 X 的矩生成函數i/√n 將是

hene 和 ΣX 的矩生成函數i/√n 將是

現在讓我們取 L(t)=logM(t)

so

展示我們首先展示的證明

通過顯示其等效形式

因此,這顯示了均值為零和方差為 1 的結果,對於一般情況,同樣的結果也可以通過取

對於每個 a 我們有

中心極限定理的例子

為了從天文學家的實驗室計算一顆恆星的光年距離,他使用了一些測量技術,但由於每次測量的距離都在變化,因此測量的距離並不准確,但存在一些誤差,因此要找到他計劃測量的準確距離在一個序列中連續觀察,並將這些距離的平均值作為估計距離,如果他考慮均值為 d 且方差為 4 光年的測量值同分佈且獨立的隨機變量,求出要進行的測量次數以獲得 0.5 誤差估計值和實際值?

解決方案:讓我們將測量視為序列 X 中的獨立隨機變量1,X2,……。Xn 所以通過 中心極限定理 我們可以寫

這是標準的近似值 正態分佈 所以概率是

所以為了獲得 95% 的測量精度,天文學家應該測量 n* 距離,其中

所以從正態分佈表我們可以把它寫成

它說測量應該進行 62 次,這也可以在 切比雪夫不等式 通過採取

所以不等式導致

因此,對於 n=16/0.05=320,這可以肯定的是,從觀測實驗室測量恆星的距離將只有 5% 的誤差。

2. 工程類錄取人數為泊松分佈,均值為100,如果錄取人數在120人以上,則分兩節教學,否則只分一節,有多大概率會錄取?是課程的兩個部分?

解決方案:通過遵循泊松分佈,確切的解決方案將是

這顯然沒有給出特定的數值,如果我們將隨機變量 X 視為錄取的學生,則由 中心極限定理

哪個可以

這是數值。

3. 計算擲骰時十個骰子的總和在 30 到 40 之間的概率,包括 30 和 40?

解決方案:這裡將骰子視為 Xi 對於 i 的十個值。 均值和方差將是

因此遵循 中心極限定理 我們可以寫

這是所需的概率。

4.對於均勻分佈的獨立隨機變量Xi 在區間 (0,1) 上,概率的近似值是多少

解:從 Unifrom 分佈我們知道均值和方差將是

現在使用 中心極限定理 我們可以

因此隨機變量的總和將為 14%。

5. 如果有 25 場考試的評分時間是獨立的,平均 450 分鐘,標準差 50 分鐘,則考試評估員在開始 20 分鐘內給出評分的概率是 4 場考試。

解決方案:考慮通過隨機變量 X 對考試進行評分所需的時間i 所以隨機變量 X 將是

由於這項 25 項考試的任務需要 450 分鐘,所以

這裡使用 中心極限定理

這是所需的概率。

獨立隨機變量的中心極限定理

對於非同分佈但具有獨立隨機變量 X 的序列1,X2,……. 每個都有均值 μ 和方差 σ2 只要滿足

  1. 每個 Xi 是均勻有界的
  2. 方差的總和是無限的,那麼

強數定律

強大數定律是非常重要的概念 概率論 這表示概率為 XNUMX 的公共分佈隨機變量序列的平均值將收斂到同一分佈的平均值

聲明:對於相同的序列 分佈 和獨立隨機變量 X1,X2,……. 其中每個都具有概率為 XNUMX 的有限均值,則

證明:為了證明這一點,考慮每個隨機變量的均值為零,並且序列

現在為此考慮這個的力量

展開右邊的項後,我們有形式的項

因為這些是獨立的所以這些的平均值將是

在這對組合的幫助下,該系列的擴展現在將是

so

我們得到

這表明不平等

於是

由於每個隨機變量的概率是一個,所以由系列的收斂性

如果每個隨機變量的均值不等於 XNUMX,那麼在偏差和概率為 XNUMX 的情況下,我們可以將其寫為

or

這是必需的結果。

單面切比雪夫不等式

如果 a>0,則隨機變量 X 的單邊切比雪夫不等式具有均值零和有限方差是

切比雪夫不等式
切比雪夫不等式

為了證明這一點,考慮 b>0 讓隨機變量 X 為

這使

所以使用 馬爾可夫不等式

切比雪夫不等式
一側切比雪夫

這給出了所需的不等式。 對於均值和方差,我們可以將其寫為

這進一步可以寫成

示例:

如果某家公司的產量均值為 120,方差為 100,請找出隨機分佈的公司的產量至少為 400 的概率的上限。

解決方案:

使用一側 切比雪夫不等式

所以這給出了一周內生產的概率至少 120 是 1/2,現在這個概率的界限將通過使用獲得 馬爾可夫不等式

它顯示了概率的上限。

示例:

一百對是從兩百個人中取出一百對男人和一百女人,找到最多三十對由一男一女組成的概率的上限。

解決方案:

讓隨機變量 Xi as

所以這對可以表示為

由於每個男人都可以與剩下的人配對的可能性相同,其中 XNUMX 人是女性,所以平均數

同樣,如果 i 和 j 不相等,則

as

因此我們有

使用 切比雪夫不等式

這說明 30 個男人和女人配對的可能性小於 XNUMX,因此我們可以通過使用 一側切比雪夫不等式

切爾諾夫界

如果矩生成函數已知,則

as

以同樣的方式,我們可以將 t<0 寫為

因此切爾諾夫界可以定義為

這個不等式代表 t 的所有值,無論是正值還是負值。

標準正態隨機變量的切爾諾夫邊界

標準的切爾諾夫界限 正態隨機變量 其矩生成函數

is

所以最小化這個不等式和右手邊的冪項給出 a>0

對於 a<0,它是

Poisson 隨機變量的 Chernoff 界限

泊松隨機變量的切爾諾夫界,其矩生成函數

is

所以最小化這個不等式和右手邊的冪項給出 a>0

那會是

切爾諾夫邊界示例

在一個遊戲中,如果一個玩家在獨立於任何過去得分的情況下同樣有可能贏得或輸掉遊戲,找到概率的切爾諾夫界限

解決方案:讓Xi 表示玩家獲勝,那麼概率將是

對於 n 次播放的序列讓

所以矩生成函數將是

這裡使用指數項的擴展

所以我們有

現在應用力矩生成函數的性質

這給出了不等式

於是

結論:

討論了大數的不等式和極限定理,並給出了概率界的合理例子,以了解這個想法,並藉助正態、泊松隨機變量和矩生成函數來證明這個概念很容易,如果您需要進一步閱讀以下書籍或更多關於概率的文章,請關注我們的 數學頁面.

謝爾頓·羅斯(Sheldon Ross)開設的第一門概率課程

紹姆的概率論和統計論綱

ROHATGI和SALEH對概率和統計的介紹

回到頁首