一、问题描述
各位网友好!我现在看的统计学教材是中国人大贾俊平主编的2004年7月出的第一版。今天上午,我在学习本书第三章《数据整理与展示》第二节“分类和顺序数据的整理与显示”中的第一点“频数与频数分布”时碰到了一个问题。这个问题来自于例3.2(本书第44页)如下:
一家市场调查公司为研究不同品牌饮料的市场占有率,对随机抽取的一家超市进行了调查。调查员在某天对50名顾客购买饮料的品牌进行了记录,如果一个顾客购买某一品牌的饮料,就将这一品牌饮料的名字记录一次。
教材提到,为了用Excel建立一张频数分布表,首先需要将不同品牌的饮料用一个数字代码来表示,比如,我们对各种品牌饮料指定的代码是:
1 可口可乐;
2 旭日升冰茶;
3 百事可乐;
4 汇源果汁;
5 露露。
然后,将各品牌的代码输入到Excel工作表中。
Excel现在把代码视为数值型数据。为建立频数分布表和条形图,Excel要求将每个品牌的代码单独作为一列,我们将代码上限输入到工作表中,这时Excel可以对数值小于或等于每一品牌代码的数据进行计数。这样,Excel提供的合计数就是各品牌的频数分布。Excel输出的结果另附图。
二、我的问题
为了使用Excel对顾客购买某一品牌饮料的频数进行统计,对各品牌指定代码是容易理解的,问题是教材中后面又突然提到代码上限,在教材中的3-10图中显示了各品牌的代码及代码上限,这里就是我理解不了的地方了,我把3-10图中的一部分表示如下:
品牌名称 代码 代码上限
旭日升冰茶 2 1
可口可乐 1 2
百事可乐 3 3
可口可乐 1 4
汇源果汁 4 5
对于这一部分,有三点让我无法理解:
第一, 旭日升冰茶的代码是2,但它的代码上限为什么是1,为什么比它的代码还小?
第二, 可口可乐的代码是1,但它的代码上限有两个,一个是2,一个是4。为什么会有两个代码上限?两个不同的代码上限分别表示什么意思?
露露的代码是5,但它没有代码上限。为什么?