离散型随机变量及其分布
知识点一:离散型随机变量的相关概念;
随机变量:如果随机试验的结果可以用一个变量来表示,那么这样的变量叫做随机 变量随机变量常用希腊字母、等表示
离散型随机变量:对于随机变量可能取的值,可以按一定次序一一列出,这样的随 机变量叫做离散型随机变量。若 •是随机变量, 是随机变量
连续型随机变量:对于随机变量可能取的值,可以取某一区间内的一切值,这样的 变量就叫做连续型随机变量
离散型随机变量与连续型随机变量的区别与联系 :离散型随机变量与连续型随机 变量都是用变量表示随机试验的结果;但是离散型随机变量的结果可以按一定次序一一 列出,而连续性随机变量的结果不可以 列出
离散型随机变量的分布列:设离散型随机变量•可能取的值为xi、X2…人取每 个值x i =1,2,…的概率为P( =Xi) = 口,则称表
b,其中a、b是常数,则 也
x
X2 P2 … … x Pi … … P P1 为随机变量•的概率分布,简称•的分布列 知识点二:离散型随机变量分布列的两个性质;
任何随机事件发生的概率都满足:0乞P(A)叮,并且不可能事件的概率为0 ,必然 事件的概率为1.由此你可以得出离散型随机变量的分布列都具有下面两个性质:
(1) Pi 王0, i =1,2,…;(2) R+巳+川=1
特别提醒:对于离散型随机变量在某一范围内取值的概率等于它取这个范围内各个值的
概率的和即P「_xk)
知识点二:两点分布:
=xk) • P(F; =xk』•丨1(
若随机变量X的分布列:
X P 0 1-P 1 P 则称X的分布列为两点分布列
特别提醒:(1)若随机变量X的分布列为两点分布,则称X服从两点分布,而称P(X=1) 为成功率
•
(2) (3)
两点分布又称为0-1分布或伯努利分布
两点分布列的应用十分广泛,如抽取的彩票是否中奖;买回的一件产品是 否为正品;新生婴儿的性别;投篮是否命中等等;都可以用两点分布列 来研究•
知识点三:超几何分布:
般地,在含有M件次品的N件产品中,任取n件,其中恰有X件次品,则
C k C n _k
p(x 二k)二 N川,k =0,1, m,m = min{M ,n},其中,n N,M < N.称超几何分布列.
MN
X P 0 C° C n-0 CCM N JM 1 • •• • • • • • * m C m「n』 CCM N JM N1 cCN 知识点四:离散型随机变量的二项分布;
在一次随机试验中,某事件可能发生也可能不发生,在
n次重复试验中这个事
件发生的次数•是一个随机变量.如果在一次试验中某事件发生的概率是 p,那么在n次 重复试验中这个事件恰好发生 k次的概率是 Pn(© =k)
pkqn」,(k 30
..., q=1-p)
于是得到随机变量•的概率分布如下:
匕 P 0 C:p0qn 1 cn p1qnA … … k C:pkqz … … n Cnnpnq0 kn±由于Cnpq恰好是二项式展开式:
(p • q)n =C;p0qn £:卩乙2 • |l「C:pkqn± VCnpF0中的各项的值,所以称这样的随 机变量■服从二项分布,记作LI B( n,p),其中n ,p为参数,并记c:pkqn上二b(k ,n, p)||| 知识点五:离散型随机变量的几何分布:
在重复试验中,某事件第一次发生时,所作试验的次数
•也是一个正整数的离
散型随机变量.“ • =k ”表示在第k次重复试验时事件第一次发生.如果把k次试验 时事件A发生记为Ak、事件A不发生记为宀,p(AJ = p, p(AJ =q, (q=1- p),那么 P(二k)二P(AA人)十(入)卩叵)卩(瓦)||冋兀)卩(乓)二q2p (k =0,1,2,… q =1 - p ) 于是得到随机变量•的概率分布如下:
2A3IHA;
1
2 pq 3 2 … k 」 q p k… … P p q p … 称这样的随机变量•服从几何分布,
记作 g(k, p) =qk'p,其中 k =0,1,2」l(,q =1 - p. 知识点六:求离散型随机变量分布列的步骤;
(1) 要确定随机变量 的可能取值有哪些•明确取每个值所表示的意义;
(2) 分清概率类型,计算•取得每一个值时的概率(取球、抽取产品等问题还要注意是 放回抽样还是
不放回抽样;
(3) 列表对应,给出分布列,并用分布列的性质验证
几种常见的分布列的求法:
•
(1) 取球、投骰子、抽取产品等问题的概率分布,关键是概率的计算 •所用方法主要有划 归法、数
形结合法、对应法等对于取球、抽取产品等问题,还要注意是放回抽样还 是不放回抽样•
(2) 射击问题:若是一人连续射击,且在n次射击中发生k次,则往往与二项分布联 系起来;
若是首次命中所需射击的次数,则它服从几何分布,若是多人射击问题, 一般利用相互事件同时发生的概率进行计算 •
(3) 对于有些问题,它的随机变量的选取与所问问题的关系不是很清楚,此时要仔细审
题,明确题中的含义,恰当地选取随机变量,构造模型,进行求解 知识点六:期望
数学期望:一般地,若离散型随机变量E的概率分布为
•
Xi P Pi X2 P2 … … Xn Pn … … 则称E - Xi Pi X2P2 .................................. Xn Pn •… 为 的数学期望,简称期望 数学期望的意义:数学期望离散型随机变量的一个特征数,
的平均水平。
平均数与均值:一般地,在有限取值离散型随机变量 E的概率分布中,令Pi二P2二… 二Pn,则有Pi = P2二…二Pn = S, E = (Xi 平均数、均值。
期望的一个性质:若「b,则E(a : b) =aE • • b 知识点七:方差;
方差:对于离散型随机变量,如果它所有可能取的值是Xi, X2,…,Xn,…,且取 这些值的概率
分别是 Pi, P2,…,Pn,…,那么, D
= (Xi - E )2
Pi +(X2
- E )2 P2 + …+
(Xn f E )2 Pn +…称为随机变量 X2 ................... Xn )
1
n
它反映了离散型随机变量取值
,所以的数学期望又称为
的均方差,简称为方差,式中的E'是随机变量■的期望.
标准差:D ■的算术平方根「D—叫做随机变量E的标准差,记作 方差的性质:① D(a • b) =a2D ';② D- - E ^(E )2 . 方差的意义:
(1) 随机变量•的方差的定义与一组数据的方差的定义式是相同的;
(2) 随机变量•的方差、标准差也是随机变量•的特征数,它们都反映了随机变量取值的 稳定与波动、
集中与离散的程度;
(3) 标准差与随机变量本身有相同的单位,所以在实际问题中应用更广泛
二项分布的期望与方差:若 几何分布的期望和方差:
若 g k,p]=q2p,其中 k=0,i,2,…,q =i - p •则 E =丄,D = ^^P .
P
知识点八:正态分布;
.
B n, p,则E二np , D二npi-p
P
(1) 频率分布:用样本估计总体,是研究统计问题的基本思想方法, 样本中所有数据(或 数据组)的频数和样本容量的比,就是该数据的频率 •所有数据(或数据组)的频率的 分布变化规律叫做样本的频率分布.可以用样本频率表、样本频率分布条形图或频率分 布直方图来表示.
(2) 总体分布:从总体中抽取一个个体,就是一次随机试验,从总体中抽取一个容量为n 的样本,
就是进行了 n次试验,试验连同所出现的结果叫随机事件,所有这些事件的概 率分布规律称为总体分布.
(3) 总体密度曲线:样本容量越大,所分组数越多,各组的频率就越接近于总体在相应各 组取值的概率•设想样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就 会无限接近于一条光滑曲线,这条曲线叫做总体密度曲线.
濒率/组距
总体密度曲线
它反映了总体在各个范围内 取值的概率•根据这条曲线,可 求出总体在区间
a, b内取值的
概率等于该区间上总体密度曲线 与
x轴、直线x=a、x = b所围
(4) 总体分布密度密度曲线函数y二f (x)的两条基本性质:
① f(x) > 0 ( R):②由曲线y二f(x)与x轴围成面积为1.
(5) 解决总体分布估计问题的一般程序如下:
① 先确定分组的组数(最大数据与最小数据之差除以组距得组数) ② 分别计算各组的频数及频率(频率
二频数); 总数
;
③ 画出频率分布直方图,并作出相应的估计.
(6) 条形图是用其咼度表示取各值的频率;直方图是用图形面积的大小表示在各区间内 取值的频率;
累积频率分布图是一条折线,利用任意两端值的累积频率之差表示样 本数据在这两点值之间的频率.
(7) 正态分布密度函数:简称正态曲线
1 丄X-R函数® u/x) = / e 2送,x^ (-°o,+=c),(式中的实数4、CT
2
>0)是参数),
i 二
b
随机变量X满足:P(a : X ^b) =
a
\\r(x)dx,则称X的分布为正态分布
其中二是圆周率;e是自然对数的底;x是随机变量的取值;■为正态分布的均值; 二是正态分布的标准差.正态分布一般记为NC;「2)。即若 D 2
N \\-2,则E'n」,
(8) 正态分布N(~二2)是由均值」和标准差二唯一决定的分布 通过固定其中一个值,讨论均值与标
准差对于正态曲线的影响