高考數學必修知識·統計與概率知識專題總結
2018-12-26 20:37:24三好網
統計:
簡單隨機抽樣
1.總體和樣本
在統計學中 , 把研究對象的全體叫做總體.
把每個研究對象叫做個體.
把總體中個體的總數叫做總體容量.
為了研究總體 x 的有關性質,一般從總體中隨機抽取一部分:x?,x?……,xn 研究,我們稱它為樣本.其中個體的個數稱為樣本容量.
2.簡單隨機抽樣,也叫純隨機抽樣。就是從總體中不加任何分組、劃類、排隊等,完全隨 機地抽取調查單位。特點是:每個樣本單位被抽中的可能性相同(概率相等),樣本的每個單位完全獨立,彼此間無一定的關聯性和排斥性。簡單隨機抽樣是其它各種抽樣形式的基礎。通常只是在總體單位之間差異程度較小和數目較少時,才采用這種方法。
3.簡單隨機抽樣常用的方法:
1>抽簽法
2>隨機數表法;
3>計算機模擬法;
4>使用統計軟件直接抽取。在簡單隨機抽樣的樣本容量設計中,主要考慮:
①總體變異情況;
②允許誤差范圍;
③概率保證程度。
4.抽簽法:
1>給調查對象群體中的每一個對象編號
2>準備抽簽的工具,實施抽簽
3>對樣本中的每一個個體進行測量或調查
例:請調查你所在的學校的學生做喜歡的體育活動情況。
5.隨機數表法:
例:利用隨機數表在所在的班級中抽取10位同學參加某項活動。
1.1.2系統抽樣
1.系統抽樣(等距抽樣或機械抽樣):
把總體的單位進行排序,再計算出抽樣距離,然后按照這一固定的抽樣距離抽取樣本。第一個樣本采用簡單隨機抽樣的辦法抽取。
K(抽樣距離)=N(總體規模)/n(樣本規模)
前提條件:總體中個體的排列對于研究的變量來說,應是隨機的,即不存在某種與研究變量相關的規則分布。可以在調查允許的條件下,從不同的樣本開始抽樣,對比幾次樣本的特點。如果有明顯差別,說明樣本在總體中的分布承某種循環性規律,且這種循環和抽樣距離重合。
2.系統抽樣,即等距抽樣是實際中最為常用的抽樣方法之一。因為它對抽樣框的要求較低,實施也比較簡單。更為重要的是,如果有某種與調查指標相關的輔助變量可供使用,總體單元按輔助變量的大小順序排隊的話,使用系統抽樣可以大大提高估計精度。
1.1.3分層抽樣
1.分層抽樣(類型抽樣):
先將總體中的所有單位按照某種特征或標志(性別、年齡等)劃分成若干類型或層次,然后再在各個類型或層次中采用簡單隨機抽樣或系用抽樣的辦法抽取一個子樣本,最后,將這些子樣本合起來構成總體的樣本。
兩種方法:
1>先以分層變量將總體劃分為若干層,再按照各層在總體中的比例從各層中抽取。
2>先以分層變量將總體劃分為若干層,再將各層中的元素按分層的順序整齊排列,最后用系統抽樣的方法抽取樣本。
2.分層抽樣是把異質性較強的總體分成一個個同質性較強的子總體,再抽取不同的子總體中的樣本分別代表該子總體,所有的樣本進而代表總體。
分層標準:
1>以調查所要分析和研究的主要變量或相關的變量作為分層的標準。
2>以保證各層內部同質性強、各層之間異質性強、突出總體內在結構的變量作為分層變量。
3>以那些有明顯分層區分的變量作為分層變量。
3.分層的比例問題:
1>按比例分層抽樣:根據各種類型或層次中的單位數目占總體單位數目的比重來抽取子樣本的方法。
2>不按比例分層抽樣:有的層次在總體中的比重太小,其樣本量就會非常少,此時采用該方法,主要是便于對不同層次的子總體進行專門研究或進行相互比較。如果要用樣本資料推斷總體時,則需要先對各層的數據資料進行加權處理,調整樣本中各層的比例,使數據恢復到總體中各層實際的比例結構。
3.用樣本估計總體時,如果抽樣的方法比較合理,那么樣本可以反映總體的信息,但從樣本得到的信息會有偏差。在隨機抽樣中,這種偏差是不可避免的.雖然我們用樣本數據得到的分布、均值和標準差并不是總體的真正的分布、均值和標準差,而只是一個估計,但這種估計是合理的,特別是當樣本量很大時,它們確實反映了總體的信息。
1.3.2兩個變量的線性相關
1、概念:
1>回歸直線方程
2>回歸系數
2.最小二乘法
3.直線回歸方程的應用
1>描述兩變量之間的依存關系;利用直線回歸方程即可定量描述兩個變量間依存的數量關系
2>利用回歸方程進行預測;把預報因子(即自變量x)代入回歸方程對預報量(即因變量Y)進行估計,即可得到個體Y值的容許區間。
3>利用回歸方程進行統計控制規定Y值的變化,通過控制x的范圍來實現統計控制的目標。如已經得到了空氣中NO2的濃度和汽車流量間的回歸方程,即可通過控制汽車流量來控制空氣中NO2的濃度。
4.應用直線回歸的注意事
1>做回歸分析要有實際意義;
2>回歸分析前,最好先作出散點圖;
3>回歸直線不要外延。
概率:
隨機事件的概率及概率的意義
1、基本概念:
1>必然事件:在條件S下,一定會發生的事件,叫相對于條件S的必然事件;
2>不可能事件:在條件S下,一定不會發生的事件,叫相對于條件S的不可能事件;
3>確定事件:必然事件和不可能事件統稱為相對于條件S的確定事件;
4>隨機事件:在條件S下可能發生也可能不發生的事件,叫相對于條件S的隨機事件;
5>頻數與頻率:在相同的條件S下重復n次試驗,觀察某一事件A是否出現,稱n次試驗中事件A出現的次數nA
概率的基本性質
1、基本概念:
1>事件的包含、并事件、交事件、相等事件
2>若A∩B為不可能事件,即A∩B=ф,那么稱事件A與事件B互斥;
3>若A∩B為不可能事件,A∪B為必然事件,那么稱事件A與事件B互為對立事件;
4>當事件A與B互斥時,滿足加法公式:P(A∪B)= P(A)+ P(B);若事件A與B為對立事件,則A∪B為必然事件,所以P(A∪B)= P(A)+ P(B)=1,于是有P(A)=1—P(B)
2、概率的基本性質:
1>必然事件概率為1,不可能事件概率為0,因此0≤P(A)≤1;
2>當事件A與B互斥時,滿足加法公式:P(A∪B)= P(A)+ P(B);
3>若事件A與B為對立事件,則A∪B為必然事件,所以P(A∪B)= P(A)+ P(B)=1,于是有P(A)=1—P(B);
4>互斥事件與對立事件的區別與聯系,互斥事件是指事件A與事件B在一次試驗中不會同時發生,其具體包括三種不同的情形:
>1事件A發生且事件B不發生;
>2事件A不發生且事件B發生;
>3事件A與事件B同時不發生,而對立事件是指事件A 與事件B有且僅有一個發生,其包括兩種情形:
>1事件A發生B不發生;
>2事件B發生事件A不發生,對立事件互斥事件的特殊情形。
2.2.1—2.2.2古典概型及隨機數的產生
1、
1>古典概型的使用條件:試驗結果的有限性和所有結果的等可能性。
2>古典概型的解題步驟;
>1求出總的基本事件數;
>2求出事件A所包含的基本事件數,然后利用公式
2.3.1—2.3.2幾何概型及均勻隨機數的產生
1、基本概念:
1>幾何概率模型:如果每個事件發生的概率只與構成該事件區域的長度(面積或體積)成比例,則稱這樣的概率模型為幾何概率模型;
2>幾何概型的概率公式:
2、幾何概型的特點:
1>試驗中所有可能出現的結果(基本事件)有無限多個;
2>每個基本事件出現的可能性相等.