概率统计¶

统计¶

定义 1. 抽样方法（人教A必修二P173）¶

简单随机抽样：放回简单随机抽样和不放回简单随机抽样的统称. 不放回简单随机抽样中，未进入样本的个体被抽概率相等. 样本：通过简单随机抽样获得的样本为简单随机样

定义 2. 随机数表抽样¶

定义 3. 总体均值与样本均值（简单随机抽样）¶

总体均值：总体有 (N ) 个个体，变量值为 (Y_1, Y_2, , Y_N )，则 ( Y = Y_1 + Y_2 + + Y_N N = 1 N _ i=

定义 4. 估计总体平均数的方法¶

简单随机抽样：从总体中用简单随机抽样抽取一个容量为 (n ) 的样本，它们的变量值分别为 (y_1,y_2, ,y_n )，则称 ( y = y_1 + y_2

结论 1. 分层抽样的均值和方差（人教A必修二P216-11）¶

定义 5. 频率分布直方图（人教A必修二P193）¶

定义 6. 百分位数¶

定义 7. 平均数¶

定义 8. 中位数¶

定义 9. 众数¶

一组数据中出现次数最多的数据即为该组数据的众数，若有几个数据出现次数一样多，且都比其它数据多，则它们都是众数. 由频率分布直方图估计样本众数，取最高的小矩形区间

定义 10. 极差¶

定义 11. 方差、标准差¶

结论 2. $ax_i+b$的数据计算¶

概率¶

定义 1. 随机试验、样本点与样本空间（人教A必修二P228）¶

把对随机现象的实现和对它的观察称为随机试验，简称试验，常用字母 ( E )表示.具有以下特点： [label= ] % 带圈数字编号相同条件下可重复进行所有

定义 2. 事件的分类¶

随机事件：可能发生也可能不发生的事件，称为随机事件，即样本空间的的子集为随机事件，把只包含一个样本点的事件称为基本事件必然事件：一定会发生的事件，称为必然事

定义 3. 事件的关系和运算¶

c c c c 事件的关系或运算含义符号表示 Venn图包含若 (A )发生，则 (B )必然发生 (A B ) [scale=0.7,yscale=0

定义 4. 古典概型（人教A必修二P228）¶

样本空间的样本点只有有限个，每个样本点发生的可能性相等. 满足这两个特征的试验称为古典概型试验，其数学模型称为古典概型. 在古典概型中，事件 (A )发生的概率

性质 1. 概率的基本性质¶

定义 5. 频率与概率（频率稳定性、随机模拟）（人教A必修二P253）¶

定义 6. 事件的独立性（人教A必修二P249）¶

随机变量及其分布¶

定义 1. 条件概率（人教A选必三P44）¶

定义 2. 乘法公式¶

定义 3. 全概率公式¶

定义 4. 离散型随机变量（人教A选必三P56）¶

一般地，对于随机试验样本空间 ( )中的每个样本点 ( )，都有唯一的实数 (X( ) )与之对应，我们称 (X ) 为随机变量 . 可能取值为有限个或可以

定义 5. 分布列¶

性质 1. 均值、方差、标准差的性质¶

定义 6. 伯努利试验¶

我们把只包含两个可能结果的试验叫做伯努利试验 . 我们将一个伯努利试验独立地重复进行 (n ) 次所组成的随机试验称为 (n ) 重伯努利试验 . 显然，

定义 7. 二项分布（人教A选必三P72）¶

结论 1. 二项分布的概率最大项¶

性质 2. 二项分布的期望和方差¶

定义 8. 超几何分布（人教A选必三P72）¶

结论 2. 超几何分布的概率最大项¶

若超几何分布 X 的分布列为 P(X = k)= C_ M ^ k C_ N - M ^ n - k C_ N ^ n ，要使得 P(X=k) 取得最大值，求

性质 3. 超几何分布的期望和方差¶

定义 9. 连续型随机变量¶

现实中，有大量问题中的随机变量不是离散型的，它们的取值往往充满某个区间甚至整个实轴，但取一点的概率为0，我们称这类随机变量为连续型随机变量 .

定义 10. 正态分布（人教A选必三P83）¶

0.55 设函数 [ f(x)= 1 2 e ^ - (x - )^2 2 ^2 ,x R . ] 其中 ( R )， ( >0 ) 为参数. 显然，对任

性质 4. 正态曲线的性质¶

性质 5. $3\sigma$ 原则¶

假设 (X N( , ^ 2 ) )，可以证明：对给定的 (k N ^* )， (P( - k X + k ) )是一个只与 (k ) 有关的定值. 特别地，

性质 6. 标准正态分布¶

在标准正态分布表中相应于 x_0 的值 (x_0) 是指总体取值小于 x_0 的概率，即 (x_0) = P(x < x_0) . x_0 0 时，则 (

定义 11. 单点分布¶

若随机变量 (X )的分布列为 [P(X = c) = 1 ]，其中 (c )为常数，则称 (X )服从单点分布 .常数可看作服从单点分布的随机变量. 期望：根

定义 12. 两点分布¶

若随机变量 (X )的分布列为 [P(X = 1) = p, P(X = 0) = 1 - p (0 < p < 1) ]，则称 (X )服从 (0

定义 13. 几何分布¶

在独立重复试验中，每次试验只有两种结果，即事件 (A )发生（概率为 (p )）和事件 (A )不发生（概率为 (1 - p )），设 (X )表示首次取得成功

定义 14. 极大似然估计¶

设总体 (X )的概率密度为 (f(x; ) )（当 (X )为离散型时， (f(x; ) )为概率分布律）， ( )，其中 ( )为待估的未知参数， ( )为

性质 7. 极大似然估计的性质¶

渐近无偏性：在一定条件下，极大似然估计量随着样本容量 (n )的增大，其期望趋近于真实参数值，即 ( _ n E( ) = ) 这意味着当样本数据足够多时，极大

定义 15. 马尔可夫链¶

马尔可夫链是一组具有无后效性的随机状态序列. 通俗地说，就是将来只受现在影响，与过去无关 . 即系统在下一个时刻的状态，只由当前时刻的状态决定，而不依赖于以往

题型 1. 无吸收壁的一维随机游走¶

一维随机游走，指在一维空间中，即一条直线数轴上，有一个可以任意移动的质点位于某处 (x = i )（ (i Z )）的地方，它能够以一定的概率向左、原地不动

题型 2. 有吸收壁的一维随机游走¶

在原定义基础上，在某个位置 (x = m ) 添加吸收壁对运动进行限制. 可以在单独一侧放置吸收壁，也可以两侧都放上吸收壁. 放上吸收壁以后，原本单调的一维空间

在原定义基础上，在某个位置 (x = m ) 添加吸收壁对运动进行限制. 可以在单独一侧放置吸收壁，也可以两侧都放上吸收壁. 放上吸收壁以后，原本单调的一维空间就有了新的可以研究的东西.在有吸收壁的一维随机游走中，我们不再去关注它处在某一位置的概率，因为这个一维空间变得不够自由，有吸收壁约束，原本的无吸收壁的递推式就不成立，研究位置概率并不好. 现在它在某位置 (x = i ) 开始不停随机运动，之后非常有可能撞上吸收壁.现在研究它从到达吸收壁的概率. 设 (P_i )为质点从 (x = i ) 到吸收壁 (x = m ) 的概率，初始位置 (x = i )，吸收壁 (x = 0 )， (x = m )，其中 (0 < i m )( (i, m Z )). 质点每个单位时间移动一次，要从 (x = i ) 到达 (x = m ) 的方式有很多种，它有可能先以 (a ) 的概率向左走一步到达 (i-1 )，再以 (p_ i-1 ) 的概率到达吸收壁 (x = m )；也有可能以 (b ) 的概率原地不动，以本来的概率 (p_i ) 到达吸收壁 (x = m )；或者是以 (c ) 的概率向右移动一步到达 (i+1 )，再以 (p_ i+1 ) 的概率到达吸收壁 (x = m ). 用全概率公式表述为： P( 从 , i , 到 , m) = P( 向左一步 )P( 从 , i , 到 , m 向左一步 ) + P( 原地不动 )P( 从 , i , 到 , m 原地不动 ) + P( 向右一步 )P( 从 , i , 到 , m 向右一步 ) 因此质点从 (x = i ) 到吸收壁 (x = m ) 的概率递推式为： [ P_i = a P_ i-1 + b P_i + c P_ i+1 ] [>=Stealth, node distance=1cm, state/.style= circle, draw, minimum size=1cm, inner sep=0pt ] [state] (0) 0 ; [state, right=of 0] (1) 1 ; [right=of 1] (d1) ; [state, right=of d1] (i-1) i-1 ; [state, right=of i-1] (i) i ; [state, right=of i] (i+1) i+1 ; [right=of i+1] (d2) ; [state, right=of d2] (m-1) m-1 ; [state, right=of m-1] (m) m ; % Transitions central part [blue, ->] (i) to[bend left=15] node[above] c (i+1); [->] (i+1) to[bend left=15] node[below] a (i); [blue, ->] (i) to[bend left=15] node[below] a (i-1); [->] (i-1) to[bend left=15] node[above] c (i); % Pi arrow directly to m % [->, dashed, thick, red] (i) to[bend right=25] node[below, red] P_i (m); [->, dashed, thick, red] (i.300) to[bend right=18] node[text=red, fill=white, inner sep=1pt] P_i (m.240); [->, dashed, thick, blue] (i-1.300) to[bend right=20] node[text=blue, fill=white, inner sep=1pt] P_ i-1 (m.240); [->, dashed, thick, blue] (i+1.310) to[bend right=15] node[text=blue, fill=white, inner sep=1pt] P_ i+1 (m.240); % Left side connections [->] (1) to[bend left=15] node[above] c (d1); [->] (d1) to[bend left=15] node[below] a (1); [->] (d1) to[bend left=15] node[above] c (i-1); [->] (i-1) to[bend left=15] node[below] a (d1); % Right side connections [->] (i+1) to[bend left=15] node[above] c (d2); [->] (d2) to[bend left=15] node[below] a (i+1); [->] (d2) to[bend left=15] node[above] c (m-1); [->] (m-1) to[bend left=15] node[below] a (d2); % End points [->] (1) to[bend left=15] node[below] a (0); % 1 -> 0 % 0 is absorbing state [->] (0) edge[loop above] node[yshift=-4pt, fill=white, inner sep=1pt] 1 (0); [->] (m-1) to[bend left=15] node[above] c (m); % m-1 -> m % m is absorbing state [->] (m) edge[loop above] node[yshift=-4pt, fill=white, inner sep=1pt] 1 (m); % Self loops (b) in 1, i-1, i+1, m-1 [->] ( ) edge[loop above] node[yshift=-4pt, fill=white, inner sep=1pt] b ( ); [blue, ->] (i) edge[loop above] node[yshift=-4pt, fill=white, inner sep=1pt] b (i); 注意:没有吸收壁的随机游走研究的是位置概率，有吸收壁的随机游走研究的是被吸收概率，所以它们的递推式才会不一样，思路也是不一样的.

例题 1.¶

【人教A选必三P81-3】如图，一个质点在随机外力的作用下，从原点 (0 ) 出发，每隔 (1 s ) 等可能地向左或向右移动一个单位，求运动 (n ) 秒后

成对数据的统计分析¶

定义 1. 变量相关性定义（人教A选必三P93）¶

如果当一个变量的值增加时，另一个变量的相应值呈现增加的趋势，就称这两个变量正相关. 如果当一个变量的值增加时，另一个变量的相应值呈现减少的趋势，则称这两个变量负

定义 2. 样本相关系数公式¶

性质 1. 样本相关系数性质¶

定义 3. 一元线性回归（人教A选必三P105）¶

定义 4. 残差¶

对于响应变量 (Y )，观测数据为观测值，经验回归方程得到的 ( y ) 为预测值，观测值减预测值为残差（随机误差的估计结果）. 用回归方程拟合变量 ( x ) 和 ( y ) 时，对样本点 ( (x_1, y_1), (x_2, y_2), , (x_n, y_n) )，称观测值 ( y_i ) 与预测值 ( y _i ) 的差 ( y_i - y _i ) 为样本点 ( (x_i, y_i) ) 的残差（ ( i=1,2, ,n )）. 将残差绘制成图称为残差图：若残差点均匀落在水平带状区域，且区域越窄，模型拟合效果越好. 例如：用线性回归模型 ( l_1 ) 和 ( l_2 ) 拟合同一数据，残差图显示 ( l_1 ) 的残差点分布在 ( x ) 轴附近更窄的带状区域，故 ( l_1 ) 拟合效果优于 ( l_2 ). [>=Stealth, scale=0.75] % ===== Scope 1: l₁ 拟合图 (左侧第一个图) ===== [xshift=0cm, yshift=0cm] % 坐标轴 [->] (0,0) -- (4,0) node[right] x ; [->] (0,0) -- (0,3.5) node[left] y ; at (0,0) [below left] O ; % 直线 l₁: y = 0.5 + 0.8x [blue, thick] (0.2, 0.66) -- (3.5, 3.3) node[right] l_1 ; % 散点 (准确计算，与残差相对应) (0.5, 0.98) circle (2pt); (1.0, 1.10) circle (2pt); (1.5, 1.85) circle (2pt); (2.0, 2.15) circle (2pt); (2.5, 2.35) circle (2pt); (3.0, 2.97) circle (2pt); % ===== Scope 2: l₁ 拟合残差图 (左侧第二个图) ===== [xshift=5cm, yshift=1.3cm] % 坐标轴 [->] (0,0) -- (4,0) node[right] x ; [->] (0,-0.8) -- (0,0.8) node[left] e ; at (0,0) [below left] O ; % 标题 at (2, 1.2) l_1 的拟合残差图 ; % 带状区域 [dashed, red, thick] (0, 0.2) -- (3.5, 0.2); [dashed, red, thick] (0, -0.2) -- (3.5, -0.2); % 残差点 (0.5, 0.08) circle (2pt); (1.0, -0.20) circle (2pt); (1.5, 0.15) circle (2pt); (2.0, 0.05) circle (2pt); (2.5, -0.15) circle (2pt); (3.0, 0.07) circle (2pt); % ===== Scope 3: l₂ 拟合图 (右侧第一个图) ===== [xshift=10cm, yshift=0cm] % 坐标轴 [->] (0,0) -- (4,0) node[right] x ; [->] (0,0) -- (0,3.5) node[left] y ; at (0,0) [below left] O ; % 直线 l₂: y = 0.8 + 0.7x [blue, thick] (0.2, 0.94) -- (3.5, 3.25) node[ right] l_2 ; % 散点 (准确计算，误差相较 l1 明显更大) (0.5, 0.95) circle (2pt); (1.0, 2.10) circle (2pt); (1.5, 1.35) circle (2pt); (2.0, 2.00) circle (2pt); (2.5, 3.05) circle (2pt); (3.0, 2.70) circle (2pt); % ===== Scope 4: l₂ 拟合残差图 (右侧第二个图) ===== [xshift=15cm, yshift=1.3cm] % 坐标轴 [->] (0,0) -- (4,0) node[right] x ; [->] (0,-0.8) -- (0,0.8) node[left] e ; at (0,0) [below left] O ; % 标题 at (2, 1.2) l_2 的拟合残差图 ; % 带状区域 [dashed, red, thick] (0, 0.6) -- (3.5, 0.6); [dashed, red, thick] (0, -0.6) -- (3.5, -0.6); % 残差点 (0.5, -0.20) circle (2pt); (1.0, 0.60) circle (2pt); (1.5, -0.50) circle (2pt); (2.0, -0.20) circle (2pt); (2.5, 0.50) circle (2pt); (3.0, -0.20) circle (2pt);

定义 5. 决定系数 $R^2$¶

题型 1. 非线性回归模型¶

通过变换（取对数、取指数、平方等）转化为线性回归模型计算，有关考题一般会给出参考数据. 例如下图的这组观测数据 ((x_1, y_1), (x_2, y_2),

定义 6. 零假设 $H_0$¶

设 (X ) 和 (Y ) 为取值于 ( 0, 1 ) 的成对分类变量，零假设为： (H_0: P(Y = 1 X = 0) = P(Y = 1 X = 1)

定义 7. $2 \times 2$ 列联表¶

[ c c c c X Y = 0 Y = 1 合计 X = 0 a b a + b X = 1 c d c + d 合计 a + c b + d n = a

定义 8. 卡方统计量与检验规则（人教A选必三P124）¶

结论 1. 独立性检验的基本步骤¶

根据小概率值的独立性检验，基本步骤如下：提出零假设 H_0 : X 和 Y 相互独立, 并给出在问题中的解释. 根据抽样数据整理出 2 2 列联表, 利用公