某车站在春运期间为改进服务,抽查了100名旅客从开始在窗口排队到购到车票所用时间t(以下简称购票时间,单位:分),得到如下表所示的频数分布表:(1)在表中填写缺失的数据;(2-七年级数学

首页 > 考试 > 数学 > 初中数学 > 统计表/2019-12-18 / 加入收藏 / 阅读 [打印]

(3)样本平均数:样本中所有个体的平均数。
(4)总体平均数:总体中所有个体的平均数,统计学中常用样本的平均数估计总体的平均数。

  • 平均数、中位数和众数关系:
    联系:
             平均数、中位数和众数都是来刻画数据平均水平的统计量,它们各有特点。对于平均数大家比较熟悉,中位数刻画了一组数据的中等水平,众数刻画了一组数据中出现次数最多的情况。
            平均数非常明显的优点之一是,它能够利用所有数据的特征,而且比较好算。另外,在数学上,平均数是使误差平方和达到最小的统计量,也就是说利用平均数代表数据,可以使二次损失最小。因此,平均数在数学中是一个常用的统计量。但是平均数也有不足之处,正是因为它利用了所有数据的信息,平均数容易受极端数据的影响。
             例如,在一个单位里,如果经理和副经理工资特别高,就会使得这个单位所有成员工资的平均水平也表现得很高,但事实上,除去经理和副经理之外,剩余所有人的平均工资并不是很高。这时,中位数和众数可能是刻画这个单位所有人员工资平均水平更合理的统计量。
            中位数和众数这两个统计量的特点都是能够避免极端数据,但缺点是没有完全利用数据所反映出来的信息。
            由于各个统计量有各自的特征,所以需要我们根据实际问题来选择合适的统计量。
            当然,出现极端数据不一定用中位数,一般,统计上有一个方法,就要认为这个数据不是来源于这个总体的,因而把这个数据去掉。比如大家熟悉的跳水比赛评分,为什么要去掉一个最高分、一个最低分呢,就认为这两个分不是来源于这个总体,不能代表裁判的鉴赏力。于是去掉以后再求剩下数据的平均数。需要指出的是,我们处理的数据,大部分是对称的数据,数据符合或者近似符合正态分布。这时候,均值(平均数)、中位数和众数是一样的。

    区别:
            只有在数据分布偏态(不对称)的情况下,才会出现均值、中位数和众数的区别。所以说,如果是正态的话,用哪个统计量都行。如果偏态的情况特别严重的话,可以用中位数。
             除了需要刻画平均水平的统计量,统计中还有刻画数据波动情况的统计量。比如,平均数同样是5,它所代表的数据可能是1、3、5、7、9,可能是4、4.5、5、5.5、6。也就是说5所代表的不同组数据的波动情况是不一样的。怎样刻画数据的波动情况呢?很自然的想法就是用最大值减最小值,即求一组数据的极差。数学中还有方差、标准差等许多用来刻画数据特征的统计量。当然这些都是教师感兴趣、值得了解的内容,不是小学数学的教学要求。

  • 平均数的求法:
    (1)公式法:
    (2)加权平均数公式: 。

  • 考点名称:直方图

    • 频数分布直方图的定义:
      在统计数据时,按照频数分布表,在平面直角坐标系中,横轴标出每个组的端点,纵轴表示频数,每个矩形的高代表对应的频数,称这样的统计图为频数分布直方图。
      相关概念:
      组数:在统计数据时,我们把数据按照不同的范围分成几个组,分成的组的个数称为组数。
      组距:每一组两个端点的差。

    • 频数分布直方图的特点:
      ①能够显示各组频数分布的情况;
      ②易于显示各组之间频数的差别。

      作直方图的目的有:
      作直方图的目的就是通过观察图的形状,判断生产过程是否稳定,预测生产过程的质量。
      1判断一批已加工完毕的产品;
      搜集有关数据。
      直方图将数据根据差异进行分类,特点是明察秋毫地掌握差异。
      2在公路工程质量管理中,作直方图的目的有:
      ①估算可能出现的不合格率;
      ②考察工序能力估算法
      ③判断质量分布状态;
      ④判断施工能力;

    • 直方图绘制注意事项:
      a. 抽取的样本数量过小,将会产生较大误差,可信度低,也就失去了统计的意义。因此,样本数不应少于50个。
      b. 组数 k 选用不当,k 偏大或偏小,都会造成对分布状态的判断有误。
      c. 直方图一般适用于计量值数据,但在某些情况下也适用于计数值数据,这要看绘制直方图的目的而定。
      d. 图形不完整,标注不齐全,直方图上应标注:公差范围线、平均值 的位置(点画线表示)不能与公差中心M相混淆;图的右上角标出:N、S、C p或 CPK.

    • 制作频数分布直方图的方法:
      ①集中和记录数据,求出其最大值和最小值。数据的数量应在100个以上,在数量不多的情况下,至少也应在50个以上。 我们把分成组的个数称为组数,每一个组的两个端点的差称为组距。
      ②将数据分成若干组,并做好记号。分组的数量在5-12之间较为适宜。
      ③计算组距的宽度。用最大值和最小值之差去除组数,求出组距的宽度。
      ④计算各组的界限位。各组的界限位可以从第一组开始依次计算,第一组的下界为最小值减去最小测定单位的一半,第一组的上界为其下界值加上组距。第二组的下界限位为第一组的上界限值,第二组的下界限值加上组距,就是第二组的上界限位,依此类推。
      ⑤统计各组数据出现频数,作频数分布表。
      ⑥作直方图。以组距为底长,以频数为高,作各组的矩形图。

      应用步骤:
      (1)收集数据。作直方图的数据一般应大于50个。
      (2)确定数据的极差(R)。用数据的最大值减去最小值 求得。
      (3)确定组距(h)。先确定直方图的组数,然后以此组数去除极差,可得直方图每组的宽度,即组距。组数的确定要适当。组数太少,会引起较大计算误差;组数太多,会影响数据分组规律的明显性,且计算工作量加大。
      (4)确定各组的界限值。为避免出现数据值与组界限值重合而造成频数据计算困难,组的界限值单位应取最小测量单位的1/2。分组时应把数据表中最大值和最小值包括在内。
      第一组下限值为:最小值-0.5;
      第一组上限值为:第一组下限值加组距;
      第二组下限值就是第一组的上限值;
      第二组上限值就是第二组的下限值加组距;
      第三组以后,依此类推定出各组的组界。
      (5)编制频数分布表。把多个组上下界限值分别填入频数分布表内,并把数据表中的各个数据列入相应的组,统计各组频数据(f )。
      (6)按数据值比例画出横坐标。
      (7)按频数值比例画纵坐标。以观测值数目或百分数表示。
      (8)画直方图。按纵坐标画出每个长方形的高度,它代表取落在此长方形中的数据数。(注意:每个长方形的宽度都是相等的。)在直方图上应标注出公差范围(T)、样本容量(n)、样本平均值(x)、样本标准偏差值(s)和x的位置等。

    • 最新内容
    • 相关内容
    • 网友推荐
    • 图文推荐