9.2.2 总体百分位数的估计
9.2.3 总体集中趋势的估计
知识点一 百分位数的计算
1.一次数学测试中,高一(1)班某小组12名学生的成绩分别是:58分、67分、73分、74分、76分、82分、82分、87分、90分、92分、93分、98分,则这次测试中,该小组12名学生成绩的75%分位数是()
A.88分
B.89分
C.90分
D.91分
2.某校调查某班30名同学所穿的鞋的尺码如下表所示:
码号
人数
则这组数据的25%分位数是()
A.33
B.34
C.35
D.36
知识点二 百分位数的实际应用
3.我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x(单位:吨),一位居民的月用水量不超过x的部分按平价收费,超出x的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.
(1)求直方图中a的值;
(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;
(3)若该市政府希望使85%的居民每月的用水量不超过标准x(单位:吨),估计x的值,并说明理由.
4.某市为了鼓励居民节约用电,实行“阶梯式”电价,将该市每户居民的月用电量划分为三档,月用电量不超过200千瓦时的部分按0.5元/千瓦时收费,超过200千瓦时但不超过400千瓦时的部分按0.8元/千瓦时收费,超过400千瓦时的部分按1.0元/千瓦时收费.
(1)求某户居民用电费用y(单位:元)关于月用电量x(单位:千瓦时)的函数解析式;
(2)为了了解居民的用电情况,通过抽样获得了今年1月份100户居民每户的用电量,统计分析后得到如图所示的频率分布直方图,若这100户居民中,今年1月份用电费用低于260元的占80%,求a,b的值;
(3)根据(2)中求得的数据计算用电量的75%分位数.
知识点三 平均数、中位数、众数的计算
5.某学习小组在一次数学测验中,得100分的有1人,95分的有1人,90分的有2人,85分的有4人,80分和75分的各有1人,则该小组成绩的平均数、众数、中位数分别是()
A.85,85,85
B.87,85,86
C.87,85,85
D.87,85,90
6.一组数据1,10,5,2,x,2,且2<x<5,若该数据的众数是中位数的倍,则该数据的平均数为()
A.3
B.4
C.4.5
D.5
7.从高三抽出50名学生参加数学竞赛,由成绩得到如图的频率分布直方图.试利用频率分布直方图求:
(1)这50名学生成绩的众数与中位数;
(2)这50名学生成绩的平均数(答案精确到0.1).
知识点四 平均数、中位数、众数的实际应用
8.某公司销售部有销售人员15人,为了制定某种商品的月销售定额,统计了这15人某月的销售量如下:
每人销售件数
1800
510
250
210
150
120
人数
(1)求这15位销售人员该月销售量的平均数、中位数及众数;
(2)假设销售部负责人把每位销售人员的月销售定额定为320件,你认为是否合理,为什么?如果不合理,请你制定一个较合理的销售定额.
9.某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.
(1)求直方图中x的值;
(2)求月平均用电量的众数和中位数;
(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用比例分配的分层随机抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?
一、选择题
1.下列说法错误的是()
A.一个样本的众数、中位数和平均数不可能是同一个数
B.统计中,我们可以用样本平均数去估计总体平均数
C.样本平均数既不可能大于也不可能小于这个样本中的所有数据
D.众数、中位数和平均数从不同的角度描述了一组数据的集中趋势
2.在某次考试中,10名同学的得分如下:84,77,84,83,68,78,70,85,79,95.则这一组数据的众数、中位数和75%分位数分别为()
A.84,68,83
B.84,78,83
C.84,81,84
D.78,81,84
3.某单位定期对员工的专业知识、工作业绩、出勤情况三个方面进行考核(考核的满分均为100分),三个方面依次按3∶5∶2确定最后得分.小王经过考核后所得的分数依次为90分、88分、83分,那么小王的最后得分是()
A.87分
B.87.5分
C.87.6分
D.88分
4.对某小区100户居民的月均用水量进行统计,得到样本的频率分布直方图如图所示,则估计此样本的众数、中位数分别为()
A.2.25,2.5
B.2.25,2.02
C.2,2.5
D.2.5,2.25
5.(多选)在某次高中学科竞赛中,4000名考生的参赛成绩统计如图所示,60分以下视为不及格,若同一组中数据用该组区间的中点值作代表,则下列说法中正确的是()
A.成绩在[70,80)内的考生人数最多
B.不及格的考生人数为1000
C.考生竞赛成绩的平均分约为70.5分
D.考生竞赛成绩的中位数为75分
二、填空题
6.从甲、乙、丙三个厂家生产的同一种产品中分别抽取8件产品,对其使用寿命(单位:年)进行追踪调查的结果如下:
甲:3,4,5,6,8,8,8,10;
乙:4,6,6,6,8,9,12,13;
丙:3,3,4,7,9,10,11,12.三个厂家广告中都称该产品的使用寿命是8年,请根据结果判断厂家在广告中分别运用了平均数、众数、中位数中的哪一种集中趋势的特征数.
甲:________,乙:________,丙:________.7.近年来,某市私家车数量持续增长,2015年至2019年该市私家车数量依次为15,19,22,26,30(单位:万辆),则该组数据的中位数是________,10%分位数是________,20%分位数是________.
8.某校100名学生的数学测试成绩频率分布直方图如图所示,分数不低于a(a为整数)即为优秀,如果优秀的人数为20人,则a的估计值是________.
三、解答题
9.统计局就某地居民的月收入(单位:元)情况调查了10000人,并根据所得数据画出了样本频率分布直方图(如图),每个分组包括左端点,不包括右端点,如第一组表示月收入在[2500,3000)内.
(1)为了分析居民的收入与年龄、职业等方面的关系,必须按月收入再从这10000人中用分层随机抽样的方法抽出100人平作进一步分析,则月收入在[4000,4500)内的应抽取多少人?
(2)估计该地居民的月收入的中位数;
(3)假设同组中的数据用该组区间的中点值代替,估计该地居民月收入的平均数.
10.对某校高三年级学生参加社区服务的次数进行统计,随机抽取M名学生,得到这M名学生参加社区服务的次数,根据此数据作出频率分布表和频率分布直方图如下:
分组
频数
频率
[10,15)
0.25
[15,20)
n
[20,25)
m
p
[25,30]
0.05
合计
M
(1)求出表中M,p及图中a的值;
(2)若该校有高三学生240人,试估计该校高三学生参加社区服务的次数在区间[10,15)内的人数;
(3)估计学生参加社区服务次数的众数、中位数及平均数.
9.2.2 总体百分位数的估计
9.2.3 总体集中趋势的估计
知识点一 百分位数的计算
1.一次数学测试中,高一(1)班某小组12名学生的成绩分别是:58分、67分、73分、74分、76分、82分、82分、87分、90分、92分、93分、98分,则这次测试中,该小组12名学生成绩的75%分位数是()
A.88分
B.89分
C.90分
D.91分
答案 D
解析 因为12×75%=9,所以这组数据的75%分位数为=91(分).故选D.2.某校调查某班30名同学所穿的鞋的尺码如下表所示:
码号
人数
则这组数据的25%分位数是()
A.33
B.34
C.35
D.36
答案 B
解析 因为30×25%=7.5,所以这组数据的25%分位数为34.故选B.知识点二 百分位数的实际应用
3.我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x(单位:吨),一位居民的月用水量不超过x的部分按平价收费,超出x的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.
(1)求直方图中a的值;
(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;
(3)若该市政府希望使85%的居民每月的用水量不超过标准x(单位:吨),估计x的值,并说明理由.
解(1)由频率分布直方图知,月均用水量在[0,0.5)中的频率为0.08×0.5=0.04.同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]中的频率分别为0.08,0.20,0.26,0.06,0.04,0.02.由0.04+0.08+0.5×a+0.20+0.26+0.5×a+0.06+0.04+0.02=1.解得a=0.30.(2)由(1)知,100位居民每人月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计全市30万居民中月均用水量不低于3吨的人数为300000×0.12=36000.(3)因为前6组的频率之和为
0.04+0.08+0.15+0.20+0.26+0.15=0.88>0.85.而前5组的频率之和为
0.04+0.08+0.15+0.20+0.26=0.73<0.85,所以2.5≤x<3,由0.3×(x-2.5)
=0.85-0.73,解得x=2.9.所以,估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准.
4.某市为了鼓励居民节约用电,实行“阶梯式”电价,将该市每户居民的月用电量划分为三档,月用电量不超过200千瓦时的部分按0.5元/千瓦时收费,超过200千瓦时但不超过400千瓦时的部分按0.8元/千瓦时收费,超过400千瓦时的部分按1.0元/千瓦时收费.
(1)求某户居民用电费用y(单位:元)关于月用电量x(单位:千瓦时)的函数解析式;
(2)为了了解居民的用电情况,通过抽样获得了今年1月份100户居民每户的用电量,统计分析后得到如图所示的频率分布直方图,若这100户居民中,今年1月份用电费用低于260元的占80%,求a,b的值;
(3)根据(2)中求得的数据计算用电量的75%分位数.
解(1)当0≤x≤200时,y=0.5x;
当200<x≤400时,y=0.5×200+0.8×(x-200)=0.8x-60;
当x>400时,y=0.5×200+0.8×200+1.0×(x-400)=x-140.所以y与x之间的函数解析式为
y=
(2)由(1)可知,当y=260时,x=400,即用电量低于400千瓦时的占80%,结合频率分布直方图可知
解得a=0.0015,b=0.0020.(3)设75%分位数为m,因为用电量低于300千瓦时的所占比例为(0.001+0.002+0.003)×100=60%,用电量低于400千瓦时的占80%,所以75%分位数m在[300,400)内,所以0.6+(m-300)×0.002=0.75,解得m=375(千瓦时),即用电量的75%分位数为375千瓦时.知识点三 平均数、中位数、众数的计算
5.某学习小组在一次数学测验中,得100分的有1人,95分的有1人,90分的有2人,85分的有4人,80分和75分的各有1人,则该小组成绩的平均数、众数、中位数分别是()
A.85,85,85
B.87,85,86
C.87,85,85
D.87,85,90
答案 C
解析 由平均数、中位数、众数的定义可知,平均数
==87;因为得85分的有4人,所以众数是85;把成绩由大到小排列为100,95,90,90,85,85,85,85,80,75,故中位数是85.6.一组数据1,10,5,2,x,2,且2<x<5,若该数据的众数是中位数的倍,则该数据的平均数为()
A.3
B.4
C.4.5
D.5
答案 B
解析 因为2<x<5,所以由小到大排列为1,2,2,x,5,10,则众数是2,中位数是(2+x),所以2=×(2+x),解得x=4,则平均数是×(1+2+2+4+5+10)=4.7.从高三抽出50名学生参加数学竞赛,由成绩得到如图的频率分布直方图.试利用频率分布直方图求:
(1)这50名学生成绩的众数与中位数;
(2)这50名学生成绩的平均数(答案精确到0.1).
解(1)由众数的概念可知,众数是出现次数最多的数.在直方图中高度最高的小长方形框的中间值的横坐标即为所求,所以由频率分布直方图得众数应为75.由于中位数是所有数据中的中间值,故在频率分布直方图中体现的是中位数的左右两边频数应相等,即频率也相等,从而就是小矩形的面积和相等.因此在频率分布直方图中将频率分布直方图中所有小矩形的面积一分为二的直线所对应的成绩即为所求.
∵0.004×10+0.006×10+0.02×10=0.04+0.06+0.2=0.3,∴前三个小矩形面积的和为0.3,而第四个小矩形面积为0.03×10=0.3,0.3+0.3>0.5,∴中位数应位于第四个小矩形内.
设其底边为x,高为0.03,令0.03x=0.2得x≈6.7,故中位数约为70+6.7=76.7.(2)样本平均值应是所有数据的平均值,取每个小矩形底边的中点值乘以每个小矩形的面积即可.
∴平均数为45×(0.004×10)+55×(0.006×10)+65×(0.02×10)+75×(0.03×10)+85×(0.021×10)+95×(0.016×10)≈73.7.知识点四 平均数、中位数、众数的实际应用
8.某公司销售部有销售人员15人,为了制定某种商品的月销售定额,统计了这15人某月的销售量如下:
每人销售件数
1800
510
250
210
150
120
人数
(1)求这15位销售人员该月销售量的平均数、中位数及众数;
(2)假设销售部负责人把每位销售人员的月销售定额定为320件,你认为是否合理,为什么?如果不合理,请你制定一个较合理的销售定额.
解(1)平均数=×(1800×1+510×1+250×3+210×5+150×3+120×2)=320,中位数为210,众数为210.(2)不合理.因为15人中有13人的销售额达不到320件,也就是说,320虽是这一组数据的平均数,但它却不能反映销售人员的一般水平.销售额定为210件合理些,这是由于210既是中位数,又是众数,是绝大部分人都能达到的销售额.
9.某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.
(1)求直方图中x的值;
(2)求月平均用电量的众数和中位数;
(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用比例分配的分层随机抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?
解(1)依题意,20×(0.002+0.0095+0.011+0.0125+x+0.005+0.0025)=1,解得x=0.0075.(2)由图可知,最高矩形的数据组为[220,240),∴众数为=230.∵[160,220)的频率之和为(0.002+0.0095+0.011)×20=0.45,依题意,设中位数为y,∴0.45+(y-220)×0.0125=0.5.解得y=224,∴中位数为224.(3)∵月平均用电量在[220,240)的用户在四组用户中所占比例为=,∴月平均用电量在[220,240)的用户中应抽取11×=5(户).
一、选择题
1.下列说法错误的是()
A.一个样本的众数、中位数和平均数不可能是同一个数
B.统计中,我们可以用样本平均数去估计总体平均数
C.样本平均数既不可能大于也不可能小于这个样本中的所有数据
D.众数、中位数和平均数从不同的角度描述了一组数据的集中趋势
答案 A
解析 用样本估计总体情况时,在一组数据中,众数、中位数和平均数可能是同一个数,例如:数据10,11,11,11,11,11,12的众数、中位数和平均数都是11.2.在某次考试中,10名同学的得分如下:84,77,84,83,68,78,70,85,79,95.则这一组数据的众数、中位数和75%分位数分别为()
A.84,68,83
B.84,78,83
C.84,81,84
D.78,81,84
答案 C
解析 将所给数据按从小到大的顺序排列是68,70,77,78,79,83,84,84,85,95,显然众数为84,而本组数据共10个,中间两个数是79,83,它们的平均数为81,即中位数为81.因为10×75%=7.5,所以这一组数据的75%分位数为84.故选C.3.某单位定期对员工的专业知识、工作业绩、出勤情况三个方面进行考核(考核的满分均为100分),三个方面依次按3∶5∶2确定最后得分.小王经过考核后所得的分数依次为90分、88分、83分,那么小王的最后得分是()
A.87分
B.87.5分
C.87.6分
D.88分
答案 C
解析 小王的最后得分=90×+88×+83×=27+44+16.6=87.6(分).故选C.4.对某小区100户居民的月均用水量进行统计,得到样本的频率分布直方图如图所示,则估计此样本的众数、中位数分别为()
A.2.25,2.5
B.2.25,2.02
C.2,2.5
D.2.5,2.25
答案 B
解析 众数是指样本中出现频率最高的数,在频率分布直方图中通常取该组区间的中点,所以众数为=2.25.中位数是频率为0.5的分界点,由频率分布直方图,可知前4组的频率和为(0.08+0.16+0.30+0.44)×0.5=0.49,因此中位数出现在第5组,设中位数为x,则(x-2)×0.5=0.01,解得x=2.02,故选B.5.(多选)在某次高中学科竞赛中,4000名考生的参赛成绩统计如图所示,60分以下视为不及格,若同一组中数据用该组区间的中点值作代表,则下列说法中正确的是()
A.成绩在[70,80)内的考生人数最多
B.不及格的考生人数为1000
C.考生竞赛成绩的平均分约为70.5分
D.考生竞赛成绩的中位数为75分
答案 ABC
解析 由频率分布直方图可得,成绩在[70,80)内的频率最高,因此考生人数最多,故A正确;由频率分布直方图可得,成绩在[40,60)内的频率为10×(0.01+0.015)=0.25,因此不及格的人数为4000×0.25=1000,故B正确;由频率分布直方图可得,平均分约为45×0.1+55×0.15+65×0.2+75×0.3+85×0.15+95×0.1=70.5(分),故C正确;因为成绩在[40,70)内的频率为10×(0.01+0.015+0.02)=0.45,在[70,80)内的频率为0.3,所以中位数为70+10×≈71.67,故D错误.故选ABC.二、填空题
6.从甲、乙、丙三个厂家生产的同一种产品中分别抽取8件产品,对其使用寿命(单位:年)进行追踪调查的结果如下:
甲:3,4,5,6,8,8,8,10;
乙:4,6,6,6,8,9,12,13;
丙:3,3,4,7,9,10,11,12.三个厂家广告中都称该产品的使用寿命是8年,请根据结果判断厂家在广告中分别运用了平均数、众数、中位数中的哪一种集中趋势的特征数.
甲:________,乙:________,丙:________.答案 众数 平均数 中位数
解析 对甲分析:8出现的次数最多,故运用了众数;
对乙分析:8既不是众数,也不是中位数,求平均数可得,平均数=×(4+6+6+6+8+9+12+13)=8,故运用了平均数;
对丙分析:共8个数据,最中间的是7和9,故其中位数是8,即运用了中位数.
7.近年来,某市私家车数量持续增长,2015年至2019年该市私家车数量依次为15,19,22,26,30(单位:万辆),则该组数据的中位数是________,10%分位数是________,20%分位数是________.
答案 22 15 17
解析 这组数据从小到大排列后,22处于最中间的位置,故这组数据的中位数是22.∵5×10%=0.5,∴该组数据的10%分位数是15,∵5×20%=1,∴该组数据的20%分位数是=17.8.某校100名学生的数学测试成绩频率分布直方图如图所示,分数不低于a(a为整数)即为优秀,如果优秀的人数为20人,则a的估计值是________.
答案 133
解析 由已知可以判断a∈[130,140),所以[(140-a)×0.015+0.01×10]×100=20.解得a≈133.三、解答题
9.统计局就某地居民的月收入(单位:元)情况调查了10000人,并根据所得数据画出了样本频率分布直方图(如图),每个分组包括左端点,不包括右端点,如第一组表示月收入在[2500,3000)内.
(1)为了分析居民的收入与年龄、职业等方面的关系,必须按月收入再从这10000人中用分层随机抽样的方法抽出100人平作进一步分析,则月收入在[4000,4500)内的应抽取多少人?
(2)估计该地居民的月收入的中位数;
(3)假设同组中的数据用该组区间的中点值代替,估计该地居民月收入的平均数.
解(1)因为(0.0002+0.0004+0.0003+0.0001)×500=0.5,所以a==0.0005.又0.0005×500=0.25,所以月收入在[4000,4500)内的频率为0.25,所以月收入在[4000,4500)内的应抽取的人数为0.25×100=25.(2)因为0.0002×500=0.1,0.0004×500=0.2,0.0005×500=0.25,0.1+0.2+0.25=0.55>0.5,所以样本数据的中位数是3500+=3900.因此估计该地居民月收入的中位数是3900元.
(3)样本平均数为(2750×0.0002+3250×0.0004+3750×0.0005+4250×0.0005+4750×0.0003+5250×0.0001)×500=3900,因此估计该地居民月收入的平均数为3900元.
10.对某校高三年级学生参加社区服务的次数进行统计,随机抽取M名学生,得到这M名学生参加社区服务的次数,根据此数据作出频率分布表和频率分布直方图如下:
分组
频数
频率
[10,15)
0.25
[15,20)
n
[20,25)
m
p
[25,30]
0.05
合计
M
(1)求出表中M,p及图中a的值;
(2)若该校有高三学生240人,试估计该校高三学生参加社区服务的次数在区间[10,15)内的人数;
(3)估计学生参加社区服务次数的众数、中位数及平均数.
解(1)由分组[10,15)内的频数是10,频率是0.25,知=0.25,所以M=40.所以10+24+m+2=40,解得m=4,所以p===0.1,a==0.12.(2)估计该校高三学生参加社区服务的次数在区间[10,15)内的人数为0.25×240=60.(3)估计学生参加社区服务次数的众数是=17.5.因为n==0.6,所以中位数落在[15,20)内,设中位数为15+x,则0.25+0.12x=0.5.解得x≈2.1.所以估计学生参加社区服务次数的中位数是15+2.1=17.1.又12.5×0.25+17.5×0.6+22.5×0.1+27.5×0.05=17.25.所以估计学生参加社区服务次数的平均数是17.25.