標題: 考研數學講座(77)數字特征知根底 [打印本頁] 作者: 戰地黃花 時間: 2010-5-22 07:40 標題: 考研數學講座(77)數字特征知根底 為了量化研究,人們在樣本空間上建立基本點與數之間的一一對應關系,記為X或Y,…… ,稱為隨機變量。
研究隨機變量,一個重要的著眼點是,隨機變量取值的分布狀況。
測量某個客觀存在的數據,測量結果必定有誤差。測量結果是隨機變量。通常我們會多測幾次,以幾次數據的平均值為測量值。這個極其普通的作法,卻恰好滿足一個優化條件。
《高等數學》知識告訴我們,優化問題:
“已知數a的n個近似值,x1,x2,……,x n,求x0,使其與這n個值的平方平均誤差最小。”即
Min{(x-x1)2+(x-x2)2 + --- +(x-x n)2}
的答案就是這n個數的平均值。
之所以給偏差以平方,是要避免正負相消而失真 。
(畫外音:請聯想隨機變量的均值,請比較這個優化條件與隨機變量方差的定義。)
在有n個指標集的評價問題中,給每個單項指標打一個分數,x1,x2,---,x n ;如果要進一步考慮各個指標的重要性,就不會簡單地給一個平均分,而是先給各個指標賦“權”。即給出總和為1的n個正小數,p1,p 2,---,p n,其大小分別表示相應那個指標的重要性。再取其“加權平均值”。即 x0 = p1 x1 + p 2 x 2 + --- + p n x n
前述“取平均值”,可以視為各次測量結果權重相等。都為1/n
1.離散型隨機變量的數學期望(均值)
設X是離散型的隨機變量,它有n個可能的取值。每一個取值表示一個可能出現的試驗結果。這個取值的概率,一定意義上顯示了“它出現的權利大小”。 概率又正好有非負性且總和為1的特點,因而可以視為“權重”。
定義離散型隨機變量的數學期望 E(X) = p1 x1 + p 2 x 2+ ……+ p n x n
這就好比是取X的加權平均值。
在X有可列無窮多個取值的情形,如果相應的級數收斂,則E(X)也存在。
離散型隨機變量函數的數學期望 ——
如果 g(t )是個連續函數,X是隨機變量,那g (X)當然也是隨機變量。特別的,若X是離散型隨機變量,那g (X)當然也是離散型隨機變量。 X → g (X) ,相當于一次數據轉換。最重要的是,立即對如影隨行的概率作相應的轉換。
(1)如果 X →g (X) 是一一對應關系,則
X的分布列 x i → p(x i)直接就是 g (X) 的分布列 g (x i) → p(x i)
(2)如果 X →g (X) 不是一一對應關系,比如有幾個X值都產生相同的函數值g (x1),則要把這幾個點的概率加起來,作為g (x1)的概率。整理完以后再寫出分布列。
比如 若隨機變量X的分布列為 -1 0 1
0.1 0.4 0.5
則隨機變量 X 2 的分布列為 0 1
0.4 0.6
有趣的是,計算E(g (X)),可以不去管函數關系是否一一對應。只需直接把所有的積項g (xi) p(x i)加到一起。 實際上,如果 g (x1) = g (x2) ,則 g (x1) p(x1)+ g (x 2) p(x 2)= g (x1)(p(x1)+ p(x 2))
計算過程中自然地進行了整理。 2 連續型隨機變量的數學期望
連續型隨機變量的定義很有特色。與《線性代數》中特征值與特征向量的定義一樣,一個定義界定了兩個概念。定義中還蘊含有概率的算法。 定義 —— 如果存在非負可積函數 f (x) ,使得隨機變量X在任一區間(a,b)內取值的概率恰為 f (x) 在此區間上的積分。且f (x) 在實軸上的積分為1,則稱隨機變量X為連續型隨機變量;稱 f (x) 為X的分布密度。 分布密度就是連續型隨機變量X的數學模型。
這里有一個隱情。在樣本空間中,事件與集合相對應。概率的基礎是集合。所需要的積分是建立在集合基礎上的“勒貝格積分”。由于大學數學只教了建立在“區間”基礎上的“黎曼積分”,因而在這里就只能打模糊說話。把積分看成黎曼積分來算。
在“黎曼積分”范疇內沒有“函數可積的充分必要條件”; “勒貝格積分”則回答了這一問題。由此可以看到,在集合基礎上討論問題,更深入,也更一般化。 連續型隨機變量X的數學期望 —— 對于連續型隨機變量X,如果它的密度f (x) 在實軸上絕對可積,則定義其數學期望為:
E(X) = x f (x)在實軸上的積分 (黎曼積分中稱為“廣義積分”。)
(畫外音:不必細究“可積”性,只需知道,連續型隨機變量X可能不存在數學期望。) 連續型隨機變量函數的數學期望 ——若X是連續型隨機變量,其分布密度為f (x),g(t )是個連續函數,在積分收斂時,定義 E(g(X )) = g(x) f (x)在實軸上的積分
特別地,如果 E(X)存在 ,則 E (a X + b) = a E(X) + b
3,隨機變量X的“方差”D (X)
要描述隨機變量X取值的分布態勢。X的第二個數字特征“方差”D (X) 應運而生。
方差D (X ) 以數學期望E(X)為參照物,描述隨機變量X的整體分布狀態。即隨機變量X的取值對于其數學期望的平均偏離。
(在“存在”的前提下——)
離散型隨機變量X的方差 —— D (X ) = E ( (X-E(X)) 2 )
連續型隨機變量X的方差 —— 若X有密度函數f (x),則
D (X ) = E ( (X-E(X)) 2 ) = (x-E(x)) 2 f (x) 在實軸上的積分
方差定義式可以繼續運算: D (X ) = E ( (X-E(X)) 2 ) = E(X 2-2X E(X) + E(X) 2)
因為數學期望的運算是線性的,且常量E(X)的期望就是自己。故
D (X ) =上式 = E(X 2)- E(X) 2 即 D (X ) + E(X) 2 = E(X 2)
通常記 σ2 = D (X ) ; μ= E(X) 則 σ2+μ2= E(X 2)
一定要熟練運用這個平方關系 。
(畫外音:為了加深印象,不妨說這是“概率勾股定理”。)
對于任意實數a與b,若隨機變量X的方差存在,則 D (a X + b) = a 2D(X) , 顯然 D(b)= 0
(畫外音:不要忘了,隨機變量可能不存在均值或方差。)