北师大应用统计硕士统计学2020年考研考试大纲及试题形式.doc

返回 相关 举报
北师大应用统计硕士统计学2020年考研考试大纲及试题形式.doc_第1页
第1页 / 共10页
亲,该文档总共10页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
1北师大应用统计硕士统计学 2020 年考研考试大纲及试题形式I 考查目标北京师范大学应用统计硕士专业学位统计学考试是为北京师范大学所招收应用统计硕士生而设置的具有选拔性质的考试科目。其目的是科学、公平、有效地测试考生是否具备攻读应用统计专业硕士所必须的基本素质、一般能力和培养潜能,以利于选拔具有发展潜力的优秀人才入学,为国家的经济建设培养具有良好职业道德、法制观念和国际视野、具有较强分析与解决实际问题能力的高层次、应用型、复合型的统计专业人才。考试要求是测试考生掌握数据收集、处理和分析的一些基本统计方法。具体来说。要求考生:1 掌握数据收集和处理的基本方法。2 掌握数据分析的基本原理和方法。3 掌握基本的概率论知识。4 具有运用统计方法分析数据和解释数据的基本能力。II 考试形式和试卷结构一、试卷满分及考试时间试卷满分为 150 分,考试时间 180 分钟。二、答题方式答题方式为闭卷、笔试。允许使用计算器(仅限具备四则运算和开方运算功能、不带有公式和文本存储功能的计算器) ,但不得使用带有公式和文本存储功能的计算器。三、试卷内容与题型结构试卷内容:统计学 120 分,概率论 30 分。题型结构:单项选择题、计算与分析题。III 考查内容一、 统计学1 调查的组织和实施。2 概率抽样与非概率抽样。3 数据的预处理。4 用图表展示定性数据。5 用图表展示定量数据。6 用统计量描述数据的水平:平均数、中位数、分位数和众数。7 用统计量描述数据的差异:极差、标准差、样本方差。8 参数估计的基本原理。9 一个总体和两个总体参数的区间估计。10 抽样调查中样本量的确定。11 假设检验的基本原理。212 一个总体和两个总体参数的检验。13 方差分析的基本原理。14 单因子方差分析的实现和结果解释。15 变量间的关系;相关关系和函数关系的差别。16 一元线性回归的估计和检验。17 残差与模型的检验。二、 概率论1 随机事件及事件的关系和运算;2 随机事件的概率;3 条件概率和全概率公式;4 随机变量的定义;5 离散型随机变量的分布列和分布函数;离散型均匀分布、二项分布和泊松分布;6 连续型随机变量的概率密度函数和分布函数;均匀分布、正态分布和指数分布;7 随机变量的期望与方差;8 随机变量函数的期望与方差。IV. 题型示例及参考答案北京师范大学硕士研究生入学考试应用统计硕士专业学位统计学试题一. 单项选择题(本题包括 125 题共 25 个小题,每小题 2 分,共 50 分。在每小题给出的四个选项中,只有一个符合题目要求,把所选项前的字母填在答题卡相应的序号内)。选择题答题卡:题号 1 2 3 4 5 6 7 8 9 10答案题号 11 12 13 14 15 16 17 18 19 20答案题号 21 22 23 24 25答案1. 为了调查某校学生的购书费用支出,从男生中抽取 60 名学生调查,从女生中抽取 40名学生调查,这种抽样方法属于( ) 。A. 简单随机抽样B. 整群抽样C. 系统抽样3D. 分层抽样2. 某班学生的平均成绩是 80 分,标准差是 10 分。如果已知该班学生的考试分数为对称分布,可以判断考试分数在 70 到 90 分之间的学生大约占( ) 。A. 95%B. 89C. 68D. 993. 已知有限总体的均值为 50,标准差为 8,从该总体中有放回地抽取样本量为 64 的简单随机样本,则样本均值的数学期望和标准误差分别为( ) 。A. 50,8B. 50,1C. 50,4D. 8,84. 根据一个具体的样本求出的总体均值 95%的置信区间( ) 。A. 以 95%的概率包含总体均值 B. 有 5%的可能性包含总体均值C. 绝对包含总体均值D. 绝对包含总体均值或绝对不包含总体均值5. 一项研究发现,2000 年新购买小汽车的人中有 40%是女性,在 2005 年所作的一项调查中,随机抽取 120 个新车主中有 57 人为女性,在 的显著性水平下,检验05.2005 年新车主中女性的比例是否有显著增加,建立的原假设和备择假设为( ) 。A 01:4%,:40HppB. C 01:,:D 440Hpp6. 在线性回归模型中,预报变量( ) 。A. 由解释变量所唯一确定B. 唯一确定解释变量C. 是随机变量D. 不是随机变量7. 在一元线性回归分析中,如果 检验的 p-值为 0.3,则意味着( ) 。FA. 预报变量与解释变量之间存在很强的的线性关系B. 预报变量与解释变量之间存在较强的线性关系C. 预报变量与解释变量之间的线性关系较弱D. 预报变量与解释变量之间没有任何关系8. 如果一组数据是近似正态分布的,则在平均数加减 2 个标准差之内的数据大约有( ) 。A. 68%B. 90%C. 95%4D. 99%9. 95%的置信水平是指( ) 。A总体参数落在一个特定的样本所构造的置信区间内的概率为 95% B总体参数落在一个特定的样本所构造的置信区间内的概率为 5%C在用同样方法构造的总体参数的多个置信区间中,包含总体参数的区间比例约为95%D在用同样方法构造的总体参数的多个置信区间中,包含总体参数的区间比例约为 5%10. 在假设检验中,如果所计算出的 p 值越小,说明( ) 。A否定原假设证据越充分B否定原假设证据越不充分C原假设越真实D备则假设越不真实11. 在下面的假定中,哪一个不属于方差分析中的假定( ) 。A每个总体都服从正态分布B. 各总体的方差相等C. 观测值是独立的D. 各总体的方差等于 012. 在方差分析中,数据的误差是用平方和来表示的,其中组间平方和反映的是( ) 。A. 一个样本观测值之间误差的大小B. 全部观测值误差的大小C. 各个样本均值之间误差的大小D. 各个样本方差之间误差的大小13. 为研究食品的包装和销售地区对其销售量是否有影响,在三个不同地区中用三种不同包装方法进行销售,根据获得的销售量数据计算得到下面的方差分析表。表中“A”单元格和“B ”单元格内的结果是( ) 。差异源 SS df MS F行 22.22 2 11.11 A列 955.56 2 477.78 B误差 611.11 4 152.78总计 1588.89 8A. 0.073 和 3.127 B. 0.023 和 43.005C. 13.752 和 0.320 D. 43.005 和 0.32014. 某非线性回归的预测方程为 ,其中自变量为时间变量, 表示第ttY).0(1iti 期,该模型表明各期的观察值( ) 。A. 每期增加 0.8 B. 每期减少 0.2C. 每期增长 80% D. 每期减少 20%15. 一所中学的教务管理人员认为,中学生中吸烟的比例超过 30%,为检验这一说法是否属实,该教务管理人员抽取一个随机样本进行检验,建立的原假设和备择假设为。检验结果是没有拒绝原假设,这表明( ) 。01:3%,:30HppA有充分证据证明中学生中吸烟的比例小于 30%B中学生中吸烟的比例小于等于 30%C没有充分证据表明中学生中吸烟的超过 30%5D有充分证据证明中学生中吸烟的比例超过 30%16. 某药品生产企业采用一种新的配方生产某种药品,并声称新配方药的疗效远好于旧的配方。为检验企业的说法是否属实,医药管理部门抽取一个样本进行检验。该检验的原假设所表达的是( ) 。A新配方药的疗效有显著提高 B新配方药的疗效有显著降低C新配方药的疗效与旧药相比没有变化 D新配方药的疗效不如旧药17. 在回归分析中,残差平方和 反映了 的总变差中( ) 。SEyA. 由于 与 之间的线性关系引起的 的变化部分xyB. 由于 与 之间的非线性关系引起的 的变化部分C. 除了 对 的线性影响之外的其他因素对 变差的影响D. 由于 的变化引起的 的误差x18. 在公务员的一次考试中,抽取 49 个应试者,得到的平均考试成绩为 81 分,标准差分。该项考试中所有应试者的平均考试成绩 95%的置信区间为( ) 。12sA811.96 B813.36 C810.48 D814.5219. 某大学共有 5000 名本科学生,每月平均生活费支出是 500 元,标准差是 100 元。假定该校学生的生活费支出为对称分布,月生活费支出在 400 元至 600 元之间的学生人数大约为( ) 。A. 4750 人 B. 4950 人 C. 4550 人 D. 3400 人20. 在某地区,羊患某种病的概率为 0.4,且每只羊患病与否是彼此独立的。今研制一种新的预防药,任选 5 只羊服用此药,若这 5 只羊均未患病,则认为这种药有效,否则就认为无效。新药无效时,但通过试验却被认为新药有效的概率为( ) 。A0.0778 B0.01 C0.02 D0.0102421. 将一颗质地均匀的骰子(它是一种各面上分别标有点数 1,2,3,4,5,6 的正方体玩具)先后抛掷 3 次,至少出现一次 6 点向上的概率是()A B C D5216 25216 31216 9121622. 离散型随机变量 的分布列为 ,其中 是未知数,如果已知 取 1 的0.ab,a概率和取 2 的概率相等,则 ( ) 。A0.2 B0.3 C0.4 D0.523. 甲乙两人将进行一局象棋比赛,考虑事件 ,则 为( ) 。A乙负 AA甲负乙胜 B甲乙平局 C甲负 D甲负或平局24. 对于随机变量 ,有 ,则 ( ) 。其中 表示随机变量 的10D方差。A0.1 B1 C10 D10025. 设函数 在区间 上等于 0.5,在此区间之外等于 0,如果 可以作为某连()fx,ab ()fx续型随机变量的密度函数,则区间 可以是( ) 。,ab6A B C D0,.50.5,21,.52,3二. 计算与分析题(本题包括 16 题共 6 个小题,第 1 小题至第 4 小题每题 20 分,第 5 小题和第 6 小题每题 10 分,共 100 分) 。1. 某企业生产的袋装食品采用自动打包机包装,每袋标准重量为 100 克。现从某天生产的一批产品中按重复抽样随机抽取 50 包进行检查,测得每包重量(克)如下:每包重量(克) 包数96-98 298-100 3100-102 34102-104 7104-106 4合计 50(1) 确定该种食品平均重量 95%的置信区间。(2) 采用假设检验方法检验该批食品的重量是否符合标准要求?( ,05.写出检验的具体步骤) 。2. 为研究大学男生体重 w(单位:公斤)与身高 h(单位:厘米) 的关系,从某大学随机抽取了 100 名男大学生,测得他们身高和体重的数据。以体重 w 为因变量,利用统计软件得到下面的回归结果( ):05.方差分析表变差来源 df SS MS F Significance F回归 985.24780 .0001残差 总计 4688.83040 参数估计表Coefficients 标准误差 t Stat P-valueIntercept -40.94818 20.00819 -2.05 0.0434h 0.60006 0.11752 5.11 .0001(1) 将方差分析表中所缺数值补齐。(2) 写出体重与身高的线性回归方程,并解释回归系数的意义。(3) 检验回归方程的线性关系是否显著?(4) 计算相关指数 ,并解释它的实际意义。2R(5) 计算估计标准误差 ,并解释它的实际意义。es3. 统计某班学生一次数学考试的成绩,结果如下表成绩 20 68 69 72 75 78 79 82 86 89 90 92 95频数 1 2 1 1 3 4 1 3 2 2 2 2 3(1) 画出该组数据的茎叶图。(2) 求这组成绩的中位数,众数。(3) 用统计软件计算得到这次成绩的均值为 79.9,标准差为 14.64,偏度系数为7-2.69 和峰度系数 10.53,根据这些指标你能认为这次数学成绩是近似服从正态分布的吗?请说明理由。4. 从参加某项体育锻炼的成年人中随机抽取 13 个男子和 10 个女子,测得他们身体中脂肪含量百分比的数据,见下表。假设男子和女子的脂肪含量百分比近似服从正态分布,且以往的数据表明两个总体的方差近似相等,根据这组数据用假设检验的方法判断男女的脂肪含量有无显著区别( )。05.观测序号 性别 脂肪含量 观测序号 性别 脂肪含量1 男 13.3 2 女 223 男 19 4 女 265 男 20 6 女 167 男 8 8 女 129 男 18 10 女 21.711 男 22 12 女 23.213 男 20 14 女 2115 男 31 16 女 2817 男 21 18 女 3019 男 12 20 女 2321 男 16 22 男 1223 男 24计算时可参考下列数据:(1) 标准正态分布:0.05 的分位数为1.64,0.025 的分位数为 1.96。(2) 自由度为 21 的中心 t 分布:0.05 的分位数为1.72,0.025 的分位数为2.08。(3) 数据表中 13 名男子的脂肪含量的均值 为 18.18,女子的脂肪含量的均值X为 22.29,离差平方和分别为 和Y 68.43)(132ii。69.254)(10ii5. 用 三类不同元件连接成两个系统 和 。当元件 都正常工作时,,ABC1N2,ABC系统 正常工作;当元件 正常工作且元件 中至少有一个正常工作时,系1NA,统 正常工作。已知元件 正常工作的概率依次为 0.80,0.90,0.90,且某2,BC个元件是否正常工作与其他元件无关。分别求系统 和 正常工作的概率 和1N21P。2P6. 设某人上班路上所需时间 (单位:分),已知上班时间为早上 8 时,他10,5NX每天 7 时出门。求,(1)他某天迟到的概率(保留四位小数) ;(2)他某周(以五天记)最多迟到一天的概率(保留二位小数) 。8计算时可参考下表:标准正态分布表: =0.8413, =0.9772, =0.9987)1()2()3(参考答案一、单项选择题1. D;2. C;3. B;4. D;5. C;6. B;7. C;8. C;9. C;10. A;11. D;12. C;13. A;14. D;15. C;16. C;17. C;18.B;19.D ;20.A;21.D;22.C;23.D;24.A;25.B。二、计算与分析题1. (1)已知: , 。50n96.125.z样本均值为: 克,32.01nfMxkii样本标准差为: 克。64.198.1)(2fxski ii由于是大样本,所以食品平均重量 95%的置信区间为: 53.02.503.632.02 nszx即(100.867,101.773) 。(2)提出假设: ,1:0H1:计算检验的统计量: 72.50634.20nsxz由于 ,所以拒绝原假设,该批食品的重量不符合标准要9.172.5205.z求。2.(1)方差分析表变差来源 df SS MS F Significance F回归 1 985.24780 985.24780 26.07 .0001残差 98 3703.58260 37.79166 9总计 99 4688.83040 (2)线性回归方程为:。hw60.9481.0表示:身高每增加一个单位,体重平均增加 0.60006 公斤。.1(3)由于 Significance F ,表明回归方程的线性关系显著。5.(4) ,表明在体重的总变差中,该线性回%01283467.92STR归方程所解释的比例为 21.01%,说明可能还有其他因素影响体重。(5) 。表明用身高来预测体重6.479.92MEnse时,平均的预测误差为 6.14749。3. (1)茎叶图如下23456789088925558888922266990022555(2)中位数为 82,众数为 78。(3)此次数学成绩不能认为是近似服从正态分布的,原因主要有以下几点:(a) 由茎叶图可以看出此次数学成绩的分布不是对称的。(b) 均值和中位数,众数三者相差比较大。(c) 偏度和峰度的绝对值比较大。4. 解:原假设 ,备则假设210:H21:H检验统计量 1.70103)69.548.3(0mnsYXT该统计量近似服从自由度为 21 的中心 t 分布,查题中给出的 t 分布的分位数。因为 ,所以在显著水平 0.05 下没有理由认为男女的脂肪含量有08.27.1无显著区别.5. 解:分别记元件 正常工作为事件 ,由已知条件可得,ABC,ABC()0.8().9()0.PP10记系统 正常工作为事件 ,则有 ;1N1N11()PABC由于事件 相互独立,所以,ABC1()()0.89.0648P记系统 正常工作为事件 ,则有2N2N;2()ABC由于 相互独立,则有, 2()1()()1()1()0.8.0.792PPPBC6. 解:(1) 他某天迟到的概率为 1587.0)()056()0( X(2) 设一周内迟到的次数为 Y,则 YB(5,0.1587),某周(以五天记) 最多迟到一天的概率为 .2.98413.57.8413.)()0()1( 5 PYP
展开阅读全文
相关资源
相关搜索
资源标签

考研文库@kaoyanwenku.com