第1章 导论

1.1统计及其应用领域随堂测验

1、数据分析所用的方法可分为理论统计和应用统计。

2、推断统计是研究如何利用样本数据来推断总是那个题特征的统计方法。

1.2统计数据的类型随堂测验

1、按照所采用的计量尺度的不同,可以将统计数据分为:
    A、分类数据
    B、顺序数据
    C、数值型数据
    D、品质数据

1.3统计中的几个基本概念随堂测验

1、“性别”是一个( )变量。
    A、分类变量
    B、顺序变量
    C、数值型变量
    D、随机变量

第1章 单元测验

1、调查某班50名学生的学习情况,则总体单位是( )
    A、该班每一名学生
    B、该班50名学生
    C、该班50名学生的学习情况
    D、该班每一名学生的学习情

2、一名统计学专业的学生为了完成其统计作业,在《统计年鉴》中找到的2006年城镇家庭的人均收入数据属于()
    A、截面数据
    B、分类数据
    C、顺序数据
    D、时间序列数据2000~2010

3、一项调查表明,在所抽取的1000个消费者中,他们每月在网上购物的平均消费是200元,他们选择在网上购物的主要原因是“价格便宜”。这里的参数是( )用来描述总体特征的概括性数字度量。
    A、所有在网上购物的消费者
    B、1000个消费者的平均消费额
    C、所有在网上购物的消费者的平均消费额
    D、1000个消费者

4、指出下面的数据哪一个属于分类数据( )
    A、购买商品的支付方式(现金、信用卡、支票)
    B、年龄
    C、工资
    D、汽车产量

5、指出下面的数据哪一个属于顺序数据( )
    A、员工对企业某项制度改革措施的态度(赞成、中立、反对)
    B、年龄
    C、工资
    D、汽车产量

6、某研究部门准备在全市200万个家庭中抽取2000个家庭,据此推断该城市所有职工家庭的年人均收入,这项研究的统计量是( )
    A、2000个家庭的人均收入
    B、2000个家庭
    C、200万个家庭
    D、200万个家庭的人均收入

7、了解居民的消费支出情况,则( )
    A、所有居民是总体
    B、居民的消费支出情况是总体
    C、居民的消费支出情况是总体单位
    D、所有居民是总体单位

8、统计学研究的基本特点是( )
    A、从数量上认识总体的特征和规律
    B、从数量上认识总体单位的特征和规律
    C、从性质上认识总体单位的特征和规律
    D、从性质上认识总体的特征和规

9、一家研究机构从IT从业者中随机抽取500人作为样本进行调查,其中60%的人回答他们的月收入在5000元以上,50%的回答他们的消费支付方式是使用信用卡。这里的“月收入”是( )
    A、数值型变量
    B、分类变量
    C、顺序变量
    D、离散变量

10、要反映我国工业企业的整体业绩水平,总体单位是( )
    A、我国每一家工业企业
    B、我国所有工业企
    C、我国工业企业总数
    D、我国工业企业的利润总额

11、调查某市职工家庭的生活状况时,统计总体是( )
    A、该市全部职工家庭
    B、该市每个职工家庭
    C、该市全部职工
    D、该市职工家庭户数

12、下表是《财富》杂志提供的按销售额和利润排列的500强公司的一个样本数据: 公司名称 销售额(百万美元) 利润额(百万美元) 行业代码 Banc One 10272 1427.0 8 CPC Intl. 9844 580.0 19 Tyson Foods 6454 87.0 19 ….…. …. …. …..… ….….. Woolworth 8092 168.7 48 在这个例子中( )
    A、总体是500强公司,总体单位是其中每一家公司
    B、总体是500强公司,样本是表中所列的公司
    C、总体是500强公司,总体单位是表中所列的公司
    D、总体是500强公司,样本是表中所列公司的销售额和利润额
    E、总体是表中所有的公司,总体单位是表中每一家公司

13、欲了解某地高等学校科研情况( )
    A、该地所有的高等学校是总体
    B、该地所有高等学校的所有科研人员是总体
    C、该地所有高等学校所有的科研项目是总体
    D、该地所有高等学校的每一科研项目是总体单位
    E、该地每一所高等学校是总体单位

14、一家具制造商购买大批木材,木材不干会影响家具的尺寸和形状。家具制造商从每批货中随机抽取5块木材检验湿度,如果其中任何一块木材的湿度超过标准,就把整批货退回。这个问题中( )
    A、总体单位是从所有木材批次中随机抽取的部分批次木材
    B、样本是从每批木材中随机抽取的5块木
    C、总体单位是购买的每一块木材
    D、总体是购买的全部木材
    E、样本是从所有木材批次中随机抽取的部分批次木材

15、全国第四次人口普查中( )
    A、人的年龄是变量
    B、全国人口数是统计总体
    C、总体单位是每一个人
    D、全部男性人口数是统计指标

16、2010年昆明市五华区城镇居民的人均可支配收入是截面数据。

17、1990年-2010年,昆明市五华区城镇居民的人均可支配收入是时间序列数据。

18、考试成绩可以分为不及格、及格、中、良、优,那么考试成绩是分类数据。

19、商品销售额为20万元、21万元、30万元等,这些数字是变量。

20、数据分析所用的方法可分为理论统计和应用统计。

21、推断统计是研究如何利用样本数据来推断总是那个题特征的统计方法。

22、统计运用大量观察法必须对所有的总体单位进行观察

第1章 单元作业

1、一家大型油漆零售商收到了许多客户关于油漆罐分量不足的抱怨。因此,他们开始检查供货商的集装箱,有问题的将其退回。最近的一个集装箱装的是2440加仑的油漆罐。这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。装满的油漆罐应为4.536kg。要求: 1、描述总体; 2、描述研究变量; 3、描述样本 4、描述推断

2、指出下面变量的类型: 1、年龄; 2、性别; 3、汽车产量; 4、员工对企业某项改革措施的态度(赞成、中立、反对); 5、购买商品时的支付方式(现金、信用卡、支票)

3、判断题(正确的打√,错误的打×) (1)2010年昆明市五华区城镇居民的人均可支配收入是截面数据。 (2)1990年-2010年,昆明市五华区城镇居民的人均可支配收入是时间序列数据。 (3)考试成绩可以分为不及格、及格、中、良、优,那么考试成绩是分类数据。 (4)商品销售额为20万元、21万元、30万元等,这些数字是变量。

4、填空题(每空5分) (1)总体是包含所研究的 的集合,它通常由所研究的 组成。 (2)样本是从 中抽取的一部分元素的集合,构成样本的元素的数目称为 。 (3) 是用来描述总体特征的概括性数字度量。 (4)统计量是 的函数。 (5)抽样的目的是根据 去估计 。 ( 40分 )

第2章 数据的图表展示

第2章 数据图表展示测试

1、10家公司的月销售额数据(万元)分别为72,63,54,54,29,26,25,23,23,20。下面哪种图形不宜用于描述这些数据( )
    A、散点图
    B、茎叶图
    C、条形图
    D、饼图

2、由一组数据的最大值、最小值、中位数和两个四分位数5个特征值绘制而成的,反映原始数据分布的图形,称为( )
    A、箱线图
    B、环形图
    C、直方图
    D、茎叶图

3、下面的哪一个图形最适合描述大批量数据分布的图形( )
    A、直方图
    B、条形图
    C、茎叶图
    D、饼图

4、将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组,这样的分组方法称为( )
    A、组距分组
    B、单变量值分组
    C、等距分组
    D、连续分组

5、下面的哪一个图形适合比较研究两个或多个总体或结构性问题( )
    A、环形图
    B、饼图
    C、直方图
    D、茎叶图

6、下面的哪一个图形最适合描述结构性问题( )
    A、饼图
    B、条形图
    C、雷达图
    D、直方图

7、将比例乘以100得到的数值称为( )
    A、频数
    B、频率
    C、比例
    D、比率

8、样本或总体中各不同类别数值之间的比值称为( )
    A、比率
    B、频率
    C、频数
    D、比例

9、下列属于定性变量的有( )
    A、职业
    B、居住区域
    C、身高
    D、体重
    E、汽车产量
    F、寿命

10、下面的数列属于( ) 身高(厘米) 人数 比重(%) 150~155 40 20 155~160 100 50 160~165 60 30 合计 200 100
    A、变量数列
    B、等距数列
    C、闭口数列
    D、品质数列
    E、异距数列

第2章 数据图表展示作业

1、下面是一个班50个学生的经济学考试成绩: 88 56 91 79 69 90 88 71 82 79 98 85 34 74 48 100 75 95 60 92 83 64 65 69 99 64 45 76 63 69 68 74 94 81 67 81 84 53 91 24 84 62 81 83 69 84 29 66 75 94 (1)对这50名学生的经济学考试成绩进行分组并将其整理成频数分布表。 (2)用茎叶图将原始数据表现出来。

第3章 数据的概括性度量

数据的概括性度量-单元测试

1、一组数据中出现频数最多的变量值称为
    A、众数
    B、中位数
    C、四分位数
    D、平均数

2、下列关于众数的叙述,不正确的是( )
    A、一组数据的众数是唯一的
    B、一组数据可能存在多个众数
    C、众数主要适用于分类数据
    D、众数不受极端值的影晌

3、一组数据排序后处于中间位置上的变量值称为( )
    A、中位数
    B、众数
    C、四分位数
    D、平均数

4、一组数据排序后处于25%和75%位置上的值称为( )
    A、四分位数
    B、众数
    C、中位数
    D、平均数

5、非众数组的频数占总频数的比例称为( )
    A、异众比率
    B、离散系数
    C、平均差
    D、标准差

6、四分位差是( )
    A、上四分位数减下四分位数的结
    B、下四分位数减上四分位数的结果
    C、下四分位数加上四分位数
    D、下四分位数与上四分位数的中间值

7、一组数据的最大值与最小值之差称为( )
    A、极差
    B、平均差
    C、标准差
    D、四分位差

8、各变量值与其平均数离差平方的平均数称为( )
    A、方差
    B、极差
    C、平均差
    D、标准差

9、变量值与其平均数的离差除以标准差后的值称为( )
    A、标准分数
    B、离散系数
    C、方差
    D、标准差

10、如果一个数据的标准分数是-2,表明该数据( )
    A、比平均数低2个标准差
    B、比平均数高出2个标准差
    C、等于2倍的平均数
    D、等于是2倍的标准差

11、如果一个数据的标准分数是3,表明该数据( )
    A、比平均数高出3个标准
    B、比平均数低3个标准
    C、等于3倍的平均数
    D、等于3倍的标准差

12、经验法则表明,当一组数据对称分布时,在平均数加减1个标准差的范围之内大约有( )
    A、68%的数据
    B、95%的数据
    C、99%的数据
    D、100%的数据

13、经验法则表明,当一组数据对称分布时,在平均数加减2个标准差的范围之内大约有( )
    A、95%的数据
    B、68%的数据
    C、99%的数据
    D、100%的数据

14、经验法则表明,当一组数据对称分布时,在平均数加减3个标准差的范围之内大约有( )
    A、99%的数据
    B、95的数据
    C、97%的数据
    D、68%的数据

15、如果一组数据不是对称分布的,根据切比雪夫不等式,对于k=2,其意义是( )
    A、至少有75%的数据落在平均数加减2个标准差的范围之内
    B、至少有89%的数据落在平均数加减2个标准差的范围之内
    C、至少有94%的数据落在平均数加减2个标准差的范围之内
    D、至少有99%的数据落在平均数加减2个标准差的范围之内

16、如果一组数据不是对称分布的,根据切比雪夫不等式,对于k=3,其意义是( )
    A、至少有89%的数据落在平均数加减2个标准差的范围之内
    B、至少有75%的数据落在平均数加减3个标准差的范围之内
    C、至少有94%的数据落在平均数加减3个标准差的范围之内
    D、至少有99%的数据落在平均数加减3个标准差的范围之内

17、如果一组数据不是对称分布的,根据切比雪夫不等式,对于k=4,其意义是( )
    A、至少有94%的数据落在平均数加减4个标准差的范围之内
    B、至少有68%的数据落在平均数加减4个标准差的范围之内
    C、至少有75%的数据落在平均数加减4个标准差的范围之内
    D、至少有99%的数据落在平均数加减4个标准差的范围之内

18、离散系数的主要用途是( )
    A、比较多组数据的离散程度
    B、反映一组数据的离散程度
    C、反映一组数据的平均水平
    D、比较多组数据的平均水平

19、比较两组数据的离散程度最适合的统计量是( )
    A、离散系数
    B、极差
    C、平均差
    D、标准差

20、偏态系数测度了数据分布的非对称性程度。如果一组数据的分布是对称的,则偏态系数( )
    A、等于0
    B、等于1
    C、大于0
    D、大于1

21、峰态通常是与标准正态分布相比较而言的。如果一组数据服从标准正态分布,则峰态系数的值( )
    A、等于0
    B、大于0
    C、小于0
    D、等于1

22、如果一组数据分布的偏态系数在0.5~1或-1~-0.5之间,则表明该组数据属于( )
    A、中等偏态分布
    B、对称分布
    C、高度偏态分布
    D、轻微偏态分布

23、如果峰态系数k>0,表明该组数据是( )
    A、尖峰分布
    B、扁平分布
    C、左偏分布
    D、右偏分布

24、某大学经济管理学院有1200名学生,法学院有800名学生,医学院有 320名学生,理学院有200名学生。在上面的描述中,众数是( )
    A、经济管理学院
    B、1200
    C、200
    D、理学院

25、某居民小区准备采取一项新的物业管理措施,为此,随机抽取了100户居民进行调查,其中表示赞成的有69户,表示中立的有22户,表示反对的有9户。描述该组数据的集中趋势宜采用( )
    A、中位数
    B、众数
    C、四分位数
    D、平均数

26、某居民小区准备采取一项新的物业管理措施,为此,随机抽取了100户居民进行调查,其中表示赞成的有69户,表示中立的有22户,表示反对的有9户。该组数据的中位数是( )。
    A、赞成
    B、69
    C、中立
    D、22

27、某班共有25名学生,期末统计学课程的考试分数分别为: 68,73,66,76, 86, 74, 61, 89, 65, 90, 69, 67, 76, 62, 81, 63, 68, 81, 70, 73,60,87,75,64,56,该班考试分数的下四分位数和上四分位数分别是( ) 。
    A、64.5和78.5
    B、67.5和71.5
    C、64.5和71.5
    D、64.5和67.5

28、假定一个样本由5个数据组成:3,7,8,9,13。该样本的方差为( )。
    A、13
    B、8
    C、9.7
    D、10.4

29、对于右偏分布,平均数、中位数和众数之间的关系是( )。
    A、平均数>中位数>众数
    B、中位数>平均数>众数
    C、众数>中位数>平均数
    D、众数>平均数>中位数

30、在某行业中随机抽取10家企业,第一季度的利润额(单位:万元)分别是: 72,63.1,54.7,54.3,29,26.9,25,23.9,23,20。该组数据的中位数为( )。
    A、27.95
    B、28.46
    C、30.2
    D、28.12

31、在某行业中随机抽取10家企业,第一季度的利润额(单位:万元)分别是: 72,63.1,54.7,54.3,29,26.9,25,23.9,23,20。该组数据的平均数为( )。
    A、39.19
    B、28.46
    C、27.95
    D、30.20

32、在某行业中随机抽取10家企业,第一季度的利润额(单位:万元)分别是: 72,63.1,54.7,54.3,29,26.9,25,23.9,23,20。该组数据的标准差为( )。
    A、19.54
    B、28.46
    C、27.95
    D、381.19

33、某班学生的统计学平均成绩是70分,最高分是96分,最低分是62分,根据这些信息,可以计算的测度离散程度的统计量是( )。
    A、极差
    B、方差
    C、标准差
    D、变异系数

34、某班学生的平均成绩是80分,标准差是10分。如果已知该班学生的考试分数为对称分布,可以判断成绩在60~100分之间的学生大约占( )。
    A、95%
    B、89%
    C、68%
    D、99%

35、某班学生的平均成绩是80分,标准差是10分。如果已知该班学生的考试分数为对称分布,可以判断成绩在70~90分之间的学生大约占( )。
    A、68%
    B、95%
    C、89%
    D、99%

36、在某公司进行的计算机水平测试中,新员工的平均得分是80分,标准差是5分。假设新员工得分的分布是未知的,则得分在65-95分的新员工至少占( )。
    A、89%
    B、75%
    C、94%
    D、95%

37、在某公司进行的计算机水平测试中,新员工的平均得分是80分,标准差是5分,中位数是86分,则新员工得分的分布形状是( )。
    A、左偏
    B、0
    C、右偏的
    D、无法确定

38、对某个高速路段驶过的120辆汽车的车速进行测量后发现,平均车速是85千米/小时,标准差是4千米/小时,下列哪个车速可以看作异常值( )。
    A、98千米/小时
    B、78千米/小时
    C、91千米/小时
    D、82千米/小时

39、下列叙述中正确的是( ).
    A、如果计算每个数据与平均数的离差,则这些离差的和总是等于零
    B、如果考试成绩的分布是对称的,平均数为75,标准差为12,则考试成绩在63~75分之间的比例大约为95%
    C、平均数和中位数相等
    D、中位数大于平均数

40、在离散程度的测度中,最容易受极端值影响的是( )。
    A、极差
    B、四分位差
    C、标准差
    D、平均差

41、在比较两组数据的离散程度时,不能直接比较它们的标准差,因为两组数据的( )。
    A、计量单位不同
    B、标准差不同
    C、方差不同
    D、数据个数不同

42、两组数据的平均数不等,但标准差相等,则( )。
    A、平均数小的,离散程度大
    B、平均数大的,离散程度大
    C、平均数小的,离散程度小
    D、两组数据的离散程度相同

数据的概括性度量-作业

1、1 简答题 1、某公司下属两个企业生产同一种产品,其产量和成本资料如下: 基期 报告期 单位成本(元) 产量(吨) 单位成本(元) 产量(吨) 甲企业 乙企业 600 700 1200 1800 600 700 2400 1600 合计 660 3000 640 4000 试问:报告期与基期相比,该公司下属各企业单位成本都没有变化,但该公司总平均成本却下降了20元,这是为什么?

2、下表中的数据反映的是1992年到2001年我国职工工资和居民消费价格增长指数: 年份 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 职工工资 增长指数(%) 118.5 124.8 135.4 121.7 112.1 103.6 100.2 106.2 107.9 111.0 居民消费 价格指数(%) 106.4 114.7 124.1 117.1 108.3 102.8 99.2 98.6 100.4 100.7 试根据上表数据比较我国1992年到2001年间职工工资平均增长指数与平均居民消费价格指数的大小。

3、下面是甲地区空气质量指数(0~50表示良好,50~100表示适中)的一组数据:28,42,58,48,45,55,60,49,50。 (1)计算全距(R=最大标志值-最小标志值)、方差和标准差; (2)已知同期观察到的乙地区空气质量指数的平均数为48.5,标准差为11.66,试对两地区的空气质量作出比较。

4、某一牧场主每年饲养600头牛。现在有人向他推荐一种个头较小的改良品种牛,每头牛吃草量较少,这样在原来同样面积的牧场上可以多养150头牛。饲养原品种牛和改良品种牛的利润如下: 净利润(元/头) 原品种牛 改良品种牛 频数 频率(%) 频率(%) –200 36 6 1 0 12 2 2 200 185 31 57 400 367 61 40 合计 600 100 100 (1)牧场主应该选择哪一种品种?为什么? (2)改良品种牛的利润和频率可能与上表的计算值有差异。当饲养改良品种牛的利润有什么变化时,牧场主会改变他在(1)中所做的选择?

第4章 概率与概率分布

第4章单元测试

1、项试验中所有可能结果的集合称为( )。
    A、样本空间
    B、事件
    C、简单事件
    D、基本事件

2、每次试验可能出现也可能不出现的事件称为( )。
    A、随机事件
    B、必然事件
    C、样本空间
    D、不可能事件

3、拋3枚硬币,用0表示反面,1表示正面,其样本空间为=( )。
    A、{000, 001, 010, 100, 011, 101, 110, 111}
    B、{1,2,3}
    C、{0,1}
    D、{ 01,10}

4、随机抽取一只灯泡,观察其使用寿命t,其样本空间为=( )。
    A、{}
    B、{t=0}
    C、{t<O}
    D、{t>0}

5、观察一批产品的合格率p,其样本空间为=( )。
    A、
    B、{0<p<1}
    C、
    D、

6、掷一枚硬币,观察其出现的是正面还是反面,并将事件A定义为:事件A=出现正面,这一事件的概率记作P(A)。则概率P(A)=1/2的含义是( )。
    A、抛掷多次硬币,出现正面的次数接近一半
    B、抛掷多次硬币,恰好有一半结果正面朝上
    C、抛掷两次硬币,恰好有一次结果正面朝上
    D、掷一次硬币,出现的恰好是正面

7、若某一事件取值的概率为1,则这一事件被称为( )
    A、必然事件
    B、随机事件
    C、不可能事件
    D、基本事件

8、抛掷一枚骰子,并考察其结果。其点数为1点或2点或3点或4点或5点或6点的概率为( ).
    A、1/6
    B、1
    C、1/4
    D、1/2

9、一家电脑公司从两个供应商处购买了同一种计算机配件,质量状况如下表所示: 供应商 正品数 次品数 合计 甲 84 6 90 乙 102 8 110 合计 186 14 200 设A=取出的一个为正品,B=取出的一个为供应商甲供应的配件。从这200个配件中任取一个进行检查,取出的一个为正品的概率为( ).
    A、0.93
    B、0.45
    C、0.42
    D、0.9333

10、一家电脑公司从两个供应商处购买了同一种计算机配件,质量状况如下表所示: 供应商 正品数 次品数 合计 甲 84 6 90 乙 102 8 110 合计 186 14 200 设A=取出的一个为正品,B=取出的一个为供应商甲供应的配件。从这200个配件中任取一个进行检查,取出的一个为供应商甲供应的配件的概率为( ).
    A、0.45
    B、0.93
    C、0.42
    D、0.9333

11、一部电梯在一周内发生故障的次数及相应的概率如下表所示: 故障次数() 0 1 2 3 概率() 0.1 0.25 0.35 表中的值为( ).
    A、0.3
    B、0.35
    C、0.10
    D、0.25

12、一家电脑配件供应商声称,他所提供的配件100个中拥有次品的个数X及概率如下表所示: 次品数() 0 1 2 3 概率() 0.75 0.12 0.08 0.05 则该供应商次品数的期望值为( ).
    A、0.43
    B、0.15
    C、0.12
    D、0.75

13、一家电脑配件供应商声称,他所提供的配件100个中拥有次品的个数X及概率如下表所示: 次品数() 0 1 2 3 概率() 0.75 0.12 0.08 0.05 则该供应商次品数的标准差为( )
    A、0.84
    B、0.43
    C、0.12
    D、0.71

14、指出下面关于n重贝努里实验的陈述中哪一个是错误的( ).
    A、在n次试验中,“成功”的次数对应一个连续型随机变量
    B、一次试验只有两个可能结果,即“成功”和“失败”
    C、每次试验成功的概率p都是相同的
    D、试验是相关独立的

15、已知一批产品的次品率为4%,从中有放回地抽取5个。则5个产品中没有次品的概率是( ).
    A、0.815
    B、0.170
    C、0.014
    D、0.999

16、指出下面的分布中哪一个不是离散型随机变量的概率分布( ).
    A、正态分布
    B、0-1分布
    C、二项分布
    D、泊松分布

17、设X是参数为n=4和p=0.5的二项随机变量,则P(X<2)=( ).
    A、0.3125
    B、0.2125
    C、0.6875
    D、0.7875

18、假定某公司职员每周的加班津贴服从均值为50元、标准差为10元的正态分布,那么全公司中每周的加班津贴会超过70元的职员比例为( )。
    A、0.0228
    B、0.9772
    C、0.6826
    D、0.3174

19、假定某公司职员每周的加班津贴服从均值为50元、标准差为10元的正态分布,那么全公司中每周的加班津贴在40-60元之间的职员比例为( )。
    A、0.6826
    B、0.9772
    C、0.0228
    D、0.3174

第4章 单元作业

1、1、写出下列随机事件的基本空间: (1)抛三枚硬币; (2)把两个不同颜色的球分别放入两个格子; (3)灯泡的寿命(单位:小时); (4)某产品的不合格率(%); (5)记录某班一次统计学测验的平均分数。

2、设随机变量,求.

3、离散型随机变量和连续型随机变量的概率分布的描述有哪些不同?连续型随机变量的概率密度与分布函数之间是什么关系?

4、消费者协会经过调查发现,某品牌空调器有重要缺陷的产品数出现的概率分布如表1所示。 表1 某品牌空调器出现重要缺陷的产品数与概率 X 0 1 2 3 4 5 6 7 8 9 10 P 0.041 0.130 0.209 0.223 0.178 0.114 0.061 0.028 0.011 0.004 0.001 根据这些数值,分别计算: (1)有2个到5个(包括2个与5个在内)空调器出现重要缺陷的可能性; (2)只有不到2个空调器出现重要缺陷的可能性; (3)有超过5个空调器出现重要缺陷的可能性。

第5章 统计量及其抽样分布

第5章 统计量及其抽样分布-单元测试

1、设是从某总体X中抽取的一个样本,下面哪一个不是统计量( )
    A、
    B、
    C、
    D、

2、抽样分布是指( )
    A、一个样本各观测值的分布
    B、总体中各观测值的分布
    C、样本统计量的分布
    D、样本数量的分布

3、根据中心极限定理可知,当样本容量充分大时,样本均值的抽样分布服从正态分布,其分布的均值为( )
    A、
    B、
    C、
    D、

4、根据中心极限定理可知,当样本容量充分大时,样本均值的抽样分布服从正态分布,其分布方差为( )。
    A、
    B、
    C、
    D、

5、从均值为X方差为X(有限)的任意一个总体中抽取大小为n的样本,则( )。
    A、当n充分大时,样本均值X的分布近似服从正态分布
    B、只有当,n<30时,样本均值又的分布近似服从正态分布
    C、样本均值的分布与n无关
    D、无论n多大,样本均值X的分布都为非正态分布

6、假设总体服从均匀分布,从此总体中抽取容量为36的样本,则样本均值的抽样分布( )。
    A、服从非正态分布
    B、近似正态分布
    C、服从均匀分布
    D、服从X分布

7、总体均值为50.标准差为X,从此总体中随机抽取容量为64的样本,则样本均值的抽样分布的均值和标准误差分别为( )。
    A、50, 8
    B、50, 1
    C、50, 4
    D、8, 8

8、某大学的一家快餐店记录了过去5年每天的营业额,每天营业额的均值为2 500元,标准差为400元。由于在某些节日的营业额偏高,所以每日营业额的分布是右偏的,假设从这5年中随机抽取100天,并计算这100天的平均营业额,则样本均值的抽样分布是( )。
    A、正态分布,均值为250元,标准差为40元
    B、正态分布,均值为2 500元,标准差为40元
    C、右偏,均值为2 500元。标准差为400元
    D、正态分布,均值为2 500元,标准差为400元

9、某班学生的年龄分布是右偏的,均值为22,标准差为4.45。如果采取重复抽样的方法从该班抽取容量为100的样本,则样本均值的抽样分布是( )。
    A、正态分布,均值为22,标准差为0. 445
    B、分布形状未知,均值为22,标准差为4. 45
    C、正态分布,均值为22,标准差为4. 45
    D、分布形状未知,均值为22,标准差为0. 445

10、在一个饭店门口等待出租车的时间是左偏的,均值为12分钟,标准差为3分钟。如果从饭店门口随机抽取100名顾客并记录他们等待出租车的时间,则该样本均值的分布服从( )。
    A、正态分布,均值为12分钟,标准差为0.3分钟
    B、正态分布,均值为12分钟,标准差为3分钟
    C、左偏分布,均值为12分钟,标准差为3分钟
    D、左偏分布,均值为12分钟,标准差为0.3分钟

11、从均值为200、标准差为50的总体中抽取容量为100的简单随机样本,样本均值的期望值是( )。
    A、150
    B、200
    C、100
    D、250

12、从均值为200、标准差为50的总体中抽取容量为100的简单随机样本,样本均值的标准差是( )。
    A、50
    B、10
    C、5
    D、15

13、某厂家生产的灯泡寿命的均值为60小时,标准差为4小时。如果从中随机抽取30只灯泡进行检测,则样本均值( )。
    A、抽样分布的标准差为4小时
    B、抽样分布近似等同于总体分布
    C、抽样分布的中位数为60小时
    D、抽样分布近似等同于正态分布,均值为60小时

第5章 单元作业

1、调节一个装瓶机,使其对每个瓶子的罐装量均值为盎司,通过观察发现这台装瓶机对每个瓶子的罐装量服从标准差、盎司的正态分布。随机抽取由这台机器罐装的9个瓶子组成一个样本,并测定每个瓶子的罐装量。试确定样本均值偏离总体均值不超过0.3盎司的概率。

期中测试

期中试卷

1、“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。这场战役因影视明星、体育明星的参与以及消费者对品尝试验优先权的抱怨而颇具特色。假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。则说法正确的是( )
    A、总体是“市场上所有的可口可乐与百事可乐消费者”
    B、样本是“抽取的1000名消费者”
    C、样本是“可口可乐”与“百事可乐”
    D、总体是影视明星、体育明星以及消费者
    E、可根据样本信息对测试者选哪个品牌做推断

2、对由实验或调查而得到的数据进行登记、审核、整理、归类,计算出各种反映总体数量特征的综合指标,并加以分析,从中抽出有用的信息,用表格或图形表示出来。这种方法属于( )
    A、统计描述法
    B、统计观察法
    C、统计推断法
    D、参数估计法

3、推断统计的主要类型是( )。
    A、参数估计
    B、假设检验
    C、预测
    D、决策
    E、描述统计

4、一家公司在招收职员时,首先要通过两项能力测试。在S项测试中,其平均分数是125分,标准差是50分;在M项测试中,其平均分数是400分,标准差是25分。一位应试者在S项测试中得了150分,在M项测试中得了425分。与平均分数相比,这位应试者的哪一项测试更为理想( )?
    A、S项测试
    B、M项测试
    C、没有区别
    D、无法判断

5、,则X落在区间内的概率( )。
    A、只与m有关
    B、只与m,有关
    C、只与有关
    D、只与m,有关

6、已知X服从二项分布,且EX=3.6,DX=1.44,则二项分布的参数为( )。
    A、n=6,p=0.6
    B、n=4,p=0.6
    C、n=6,p=0.4
    D、n=12,p=0.3
    E、n=9,p=0.4

7、设随机变量X和Y都服从标准正态分布,则下面说法正确的是( )。
    A、都服从分布
    B、/都服从F分布
    C、+服从分布
    D、X+Y服从正态分布
    E、如果X,Y相互独立,则X+Y服从正态分布
    F、服从t分布

8、若一组数据服从正态分布,则下列判断错误的有( )。
    A、正态随机变量落入其均值左右各1个标准差内的概率是68.27%
    B、正态随机变量落入其均值左右各2个标准差内的概率是68.27%
    C、正态随机变量落入其均值左右各4个标准差内的概率是99.73%
    D、正态随机变量落入其均值左右各2个标准差内的概率是95.45%
    E、正态随机变量落入其均值左右各3个标准差内的概率是99.73%
    F、正态随机变量落入其均值左右各6个标准差外的概率为十亿分之二

9、以下关于分布的描述中,哪些是错误的( )
    A、属于左偏分布
    B、可用于单因素方差分析
    C、其变量值始终为正
    D、随着自由度的增大趋于对称
    E、具有可加
    F、属于右偏分布
    G、数学期望等于自由度,方差等于2n(n为自由度)

10、某工厂为检查流水线生产的产品质量,每隔4小时,抽取5分钟生产的全部产品进行检查。这种抽样方式属于( )抽样。
    A、整群
    B、纯随机
    C、分层
    D、两阶段
    E、系统

11、当总体内部差异比较大时,比较适合的抽样组织方式是( )。
    A、纯随机抽样
    B、分层抽样
    C、简单随机抽样
    D、整群抽样
    E、系统抽样
    F、普查

12、参数和统计量是没有区别的。( )

13、对连续大量生产的某种小件产品进行质量检验,最恰当的调查方法是全面调查。( )

14、概率密度曲线位于X轴的上方并且与X轴之间的面积为1。( )

15、设事件A发生的概率为1/10,则试验10次,该事件必然发生1次。( )

16、泊松分布的数学期望与方差相等。( )

17、概率的基本法则是,如果一个给定事件的所有可能性都相同,那么某个特定结果出现的概率等于1除以所有可能性的个数。

18、如果一个样本因人故意操纵而出现偏差,这种误差属于抽样误差。

19、对某家公司进行审计,该公司年度内的所有发票是55400张,审计人员从中随机抽查了100张发票进行审查,发现有2张发票有差错。则总体是100张发票,样本是2张发票。( )

20、在某城市随机抽取13个家庭,调查得到每个家庭的人均月收入数据如下:1050、750、1050、850、960、2000、1250、1050、760、1080、950、1050、660,则其众数为1050,中位数为1050。

21、算术平均数易受极大值影响,而调和平均数易受极小值影响。

22、环形图适合比较研究两个或多个总体或结构性问题。

23、研究人员根据对研究对象的了解有目的的选择一些单位作为样本,这种调查方式是自愿抽样。

24、某居民小区准备采取一项新的物业管理措施,为此,随机抽取了100户居民进行调查,其中表示赞成的有69户,表示中立的有22户,表示反对的有9户。描述该组数据的集中趋势宜采用四分位数.

25、系统抽样不属于概率抽样。

26、两组数据的平均数不等,但标准差相等,则平均数大的,离散程度大。

27、在比较两组数据的离散程度时,不能直接比较它们的标准差,因为两组数据的计量单位不同。

28、如果计算每个数据与平均数的离差,则这些离差的和总是等于零。

29、对某个高速路段驶过的120辆汽车的车速进行测量后发现,平均车速是85千米/小时,标准差是4千米/小时,98千米/小时可以看作异常值。

30、在某公司进行的计算机水平测试中,新员工的平均得分是80分,标准差是5分,中位数是86分,则新员工得分的分布形状是右偏的。

期中试卷

1、某一牧场主每年饲养600头牛。现在有人向他推荐一种个头较小的改良品种牛,每头牛吃草量较少,这样在原来同样面积的牧场上可以多养150头牛。饲养原品种牛和改良品种牛的利润如下: 净利润(元/头) 原品种牛 改良品种牛 频数 频率(%) 频率(%) –200 36 6 1 0 12 2 2 200 185 31 57 400 367 61 40 合计 600 100 100 (1)牧场主应该选择哪一种品种?为什么? (2)改良品种牛的利润和频率可能与上表的计算值有差异。当饲养改良品种牛的利润有什么变化时,牧场主会改变他在(1)中所做的选择?

2、设随机变量X,其中,n>1,令,请给出Y服从什么分布。

3、指出下列分布中参数所表示的意义,并指出参数的取值范围。 (1)二点分布 (2)泊松分布 (3)正态分布

4、随机抽取25个网络用户,得到他们的年龄数据如表所示。 要求: (1)计算众数、中位数。 (2)计算平均数和标准差。 (3)计算偏态系数和峰态系数。 (4)对网民年龄的分布特征进行综合分析。

第6章 参数估计

参数估计-单元测试

1、一个95%的置信区间是指( )。
    A、总体参数有95%的概率落在这一区间内
    B、总体参数有5%的概率未落在这一区间内
    C、在用同样方法构造的总体参数的多个区间中,有95%的区间包含该总体参数
    D、在用同样方法构造的总体参数的多个区间中,有95%的区间不包含该总体参数

2、95%的置信水平是指( )。
    A、总体参数落在一个特定的样本所构造的区间内的概率为95%
    B、在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比例为95%
    C、总体参数落在一个特定的样本所构造的区间内的概率为5%
    D、在用同样方法构造的总体参数的多个区间中,包总体参数的区间比例为5%

3、在置信水平不变的条件下,要缩小置信区间,则( )。
    A、需要增加样本量
    B、需要减少样本量
    C、需要保持样本量不变
    D、需要改变统计量的抽样标准差

4、当正态总体的方差已知时,在大样本条件下,估计总体均值使用的分布是( )。
    A、正态分布
    B、t分布
    C、分布
    D、F分

5、当正态总体的方差未知时,在大样本条件下,估计总体均值使用的分布是( )。
    A、正态分布
    B、t分布
    C、分布
    D、F分布

6、当正态总体的方差未知时,在小样本条件下,估计总体均值使用的分布是( )。
    A、正态分布
    B、t分布
    C、分布
    D、F分布

7、当正态总体的方差已知时,在小样本条件下,估计总体均值使用的分布是( )。
    A、正态分布
    B、t分布
    C、分布
    D、F分布

8、对于非正态总体,在大样本条件下,估计总体均值使用的分布是( )。
    A、正态分布
    B、t分布
    C、分布
    D、F分布

9、置信系数表达了置信区间的( )。
    A、准确性
    B、精确性
    C、显著性
    D、可靠性

10、当样本量一定时,置信区间的宽度( )。
    A、随着置信系数的增大而减小
    B、与置信系数的大小无关
    C、随着置信系数的增大而增大
    D、与置信系数的平方成反比

11、估计量是用来估计总体参数的估计量的名称。

12、估计量是用来估计总体参数的统计量的具体数值。

13、在参数估计中,要求通过样本的统计量来估计总体参数,评价统计量的标准之一是使它与总体参数的离差越小越好。这种评价标准称为无偏性。

14、在参数估计中,要求通过样本的统计量来估计总体参数,评价统计量的标准之一是使它与总体参数的离差越小越好。这种评价标准称为有效性。

15、在参数估计中,要求通过样本的统计量来估计总体参数,评价统计量的标准之一是使它与总体参数的离差越小越好。这种评价标准称为一致性。

16、无偏估计是指所有可能样本估计值的数学期望等于待估总体参数

17、无偏估计是指样本估计值围绕待估总体参数使其误差最小

18、当样本量一定时,置信区间的宽度随着置信系数的增大而增大

19、当样本量一定时,置信区间的宽度与置信系数的大小无关

第6章 单元作业

1、什么是置信区间?说明置信区间对应的置信度的含义。

2、假设0.5、1.25、0.8、2.00是来自总体X的一组观测值,已知服从正态分布。(每小题10分) (1)求X的数学期望(记为b); (2)求的置信度为0.95的置信区间; (3)利用上述结果求b的置信度为0.95的置信区间。

最终测试

客观题考试试卷

1、为了估计全国高中学生的平均身高,从20个城市选取了100所中学进行调查。在该项研究中,样本是( )。
    A、100所中学
    B、100所中学的高中学生
    C、全国的高中学生
    D、20个城市

2、要了解某市工业企业生产设备情况,则统计总体是( )。
    A、该市工业企业的全部生产设备
    B、该市全部工业企业
    C、该市每一个工业企业
    D、该市工业企业的每一台设备

3、一位教授计算了全班20个同学考试成绩的均值、中数和众数,发现大部分同学的考试成绩集中于高分段,下面哪句话不可能是正确的?( )
    A、全班65%的同学的考试成绩高于均值
    B、全班65%的同学的考试成绩高于中位数
    C、全班65%的同学的考试成绩高于众数
    D、全班同学的考试成绩是负偏态分布

4、比较两个不同平均数的同类现象或两个性质不同的不同类现象平均数的代表性大小时,采用( )。
    A、全距
    B、标准差系数
    C、标准差
    D、平均差

5、由8位销售员一个月销售某产品的数量制作的茎叶图如图所示,则销售量的中位数为( )。
    A、5
    B、45
    C、56.5
    D、6.5

6、某研究人员于2009年发表的一篇文章讨论了男性和女性硕士应届毕业生起薪的差别。文章称,从某重点大学前20名统计学院毕业的女性的平均起薪是3500元,中位数是3600元,标准差是550元。根据这些数据可以判断,女性起薪的分布形状是( )。
    A、对称
    B、右偏
    C、左偏
    D、均匀

7、偏态系数是对数据分布偏斜程度的测度,下面描述正确的是:( )。
    A、偏态系数=0为对称分布
    B、偏态系数>0为右偏分布
    C、偏态系数<0为右偏分布
    D、偏态系数>1或偏态系数<-1为高度偏态分布
    E、偏态系数>3或偏态系数<-3为高度偏态分布
    F、偏态系数>0为左偏分布

8、拋3枚硬币,用0表示反面,1表示正面,其样本空间为=( )。
    A、{000, 001, 010, 100, 011, 101, 110, 111}
    B、{1,2,3}
    C、{0,l}
    D、{ 01,10}

9、掷一枚硬币,观察其出现的是正面还是反面,并将事件A定义为:事件A=出现正面,这一事件的概率记作P(A)。则概率P(A)=1/2的含义是( )。
    A、抛掷多次硬币,恰好有一半结果正面朝上
    B、抛掷两次硬币,恰好有一次结果正面朝上
    C、抛掷多次硬币,出现正面的次数接近一半
    D、掷一次硬币,出现的恰好是正面

10、一家公司在招收职员时,首先要通过两项能力测试。在S项测试中,其平均分数是125分,标准差是25分;在M项测试中,其平均分数是400分,标准差是50分。一位应试者在S项测试中得了150分,在M项测试中得了425分。与平均分数相比,这位应试者的哪一项测试更为理想( )?
    A、S项测试
    B、M项测试
    C、没有区别
    D、无法判断

11、设总体是样本,是样本均值,则( )。
    A、
    B、
    C、
    D、

12、在进行区间估计时( ).
    A、置信概率越小,相应的置信区间也越小
    B、置信概率越小,相应的置信区间越大
    C、置信概率越大,相应的置信区间越小
    D、置信概率的大小不影响置信区间的大小

13、一个估计量的一致性是指( )。
    A、该估计量的数学期望等于被估计的总体参数
    B、该估计量的方差比其他估计量小
    C、随着样本量的增大该估计量的值越来越接近被估计的总体参数
    D、该估计量的方差比其他估计量大

14、关于样本的大小,下列说法错误的是( )。
    A、总体方差大,样本容量应该大
    B、总体方差小,样本容量应该大
    C、要求可靠性越高,所需样本容量就越大
    D、要求推断比较精确,样本容量应该大一些

15、在参数估计中利用t分布构造置信区间的条件是( )。
    A、总体分布为正态分布,方差未知
    B、总体分布需服从正态分布且方差已知
    C、总体不一定是正态分布但须是大样本
    D、总体不一定是正态分布,但需要方差已知

16、小区的写字楼月租金的标准差为80元,要估计总体均值95%的置信区间,希望的允许误差为15元,应抽取的样本量为( )。
    A、100
    B、110
    C、120
    D、130

17、在假设检验中,接受原假设时,( )。
    A、可能会犯第I类错误
    B、可能会犯第II类错误
    C、可能会犯第I、II两类错误
    D、不会犯错误

18、在假设检验中,1-α是指( )。
    A、拒绝了一个真实的原假设的概率
    B、接受了一个真实的原假设的概率
    C、拒绝了一个错误的原假设的概率
    D、接受了一个错误的原假设的概率

19、在假设检验中,1-β是指( )。
    A、拒绝了一个正确的原假设的概率
    B、接受了一个正确的原假设的概率
    C、拒绝了一个错误的原假设的概率
    D、接受了一个错误的原假设的概率

20、进行假设检验时,在其他条件不变的情况下,增加样本量,检验结论犯两类错误的概率会( )。
    A、都减小
    B、都增大
    C、都不变
    D、一个增大一个减小

21、搜集数据的组织方式有( )。
    A、普查
    B、抽样调查
    C、重点调查
    D、统计报表制度
    E、系统抽样

22、推断统计的两种主要类型是( )。
    A、参数估计
    B、预测
    C、决策
    D、假设检验
    E、描述统计

23、经济普查是( ).
    A、专门调查
    B、一次性调查
    C、全面调查
    D、非全面调查

24、中位数( ).
    A、由变量值在数列中所处位置决定的
    B、根据变量值出现的次数决定的
    C、是一个位置代表值
    D、不受极端数值的影响

25、关于众数,下列说法正确的有( )。
    A、众数一定大于中位数
    B、众数可以不存在
    C、众数是数值平均数
    D、众数不易受极端值的影响
    E、正态分布中,分布最高峰点所对应的数值即众数

26、加权算术平均数的大小( )。
    A、受权重的影响
    B、受各组标志值大小的影响
    C、受各组单位数在总体单位总数比重的影响
    D、与总体方差大小密切相关
    E、受离散程度大小的影响

27、在进行区间估计时,影响区间宽度的因素有( )。
    A、置信水平(1-α)
    B、数据的离散程度
    C、点估计值
    D、样本容量
    E、以上都是

28、下列说法中正确的有( )。
    A、样本均值是总体均值μ的无偏估计量
    B、样本比例p是总体比例P的无偏估计量
    C、样本标准差是总体标准差的无偏估计量
    D、样本方差是总体方差的无偏估计量
    E、样本中位数和样本均值都是总体均值的无偏估计量,但样本均值具有较小方差

29、根据原假设的情况,假设检验中的临界值( )。
    A、只能有一个,不可能有两个
    B、有时为一个,有时有两个
    C、只会为正值
    D、总是以零为中心,呈对称分布
    E、有时会有负值

30、下列关于β错误的说法,正确的是( )。
    A、是在原假设真实的条件下发生的
    B、是在原假设不真实的条件下发生的
    C、取决于原假设与实际值之间的差距
    D、原假设与实际值之间的差距越大,犯β错误的可能性越小
    E、原假设与实际值之间的差距越小,犯β错误的可能性越大

31、第二手数据可以通过抽样调查获得。( )

32、对某家公司进行审计,该公司年度内的所有发票是55400张,审计人员从中随机抽查了100张发票进行审查,发现有2张发票有差错。则总体是100张发票,样本是2张发票。( )

33、众数是总体中出现最多的次数。( )

34、当数据呈高度偏态时,中位数比算术平均数更具有代表性。

35、甲地职工工资的标准差为20元,乙地职工工资的标准差为18元,所以甲地职工工资的差异程度一定大于乙地。( )

36、茎叶图类似于横置的直方图,两者既能给出数据的分布状况,又能给出每一个原始数值。( )

37、概率的基本法则是,如果一个给定事件的所有可能性都相同,那么某个特定结果出现的概率等于1除以所有可能性的个数。( )

38、在一定的抽样平均误差条件下,扩大极限误差范围,可以提高推断的可靠程度。( )

39、在其他条件不变的情况下,提高抽样估计的可靠程度,其精确程度将随之扩大。( )

40、估计量是指用来估计总体参数计算出来的统计量的具体数值。( )

41、参数和统计量是没有区别的。( )

42、当正态总体方差已知时,在小样本情况下可以用正态分布对总体均值进行估计。( )

43、一个无偏估计量意味着它非常接近总体的参数。( )

44、所谓小概率原理是指发生概率很小的事件,在试验中不可能发生。( )

45、在总体方差未知情况下进行均值检验,一定要用t统计量。( )

46、拒绝原假设说明原假设是错误的。( )

47、在进行假设检验时,只要总体服从正态分布,则应该使用z检验统计量。( )

最终主观试卷

1、1997年我国几个大城市各月份的平均相对湿度箱线图,如下图所示: 试分析各城市平均相对湿度的分布特征。

2、一项关于大学生体重状况的研究发现,男生的平均体重为60kg,标准差为5kg;女生的平均体重为50kg,标准差为5kg。请回答下面的问题: (1)是男生的体重差异大还是女生的体重差异大?为什么? (2)以磅为单位(1kg=2.2磅),求体重的平均数和标准差。 (3)粗略地估计一下,男生中有百分之几的人体重在55kg~65kg之间? (4)粗略地估计一下,女生中有百分之几的人体重在40kg~60kg之间?

3、请说明什么是泊松分布,给出泊松分布的公式及期望、方差;举两个生活中泊松分布的例子,并说明泊松分布与二项分布的关系。

4、酒店房价收到很多因素的影响,为了分析影响酒店房价的因素有哪些,以北京高端酒店的数据为例,进行影响因素分析。现用1997-2017年北京高端酒店的数据,共566条数据进行分析。现为了考察综合评分与房价之间的关系,先绘制二者散点图(图1),然后将综合评分分为低分和高分两大类别,其中低分为评分低于4.5分,4.5及以上为高档,绘制的箱线图如图2所示。 图1 图2 请回答,你会选择图1还是图2来表现综合评分和房价之间的关系,并说明理由。