… Page 137…
图形分布大致可分为三类:
(1)对称分布(正态分布)
对称分布的图形如钟形(见图 6—1)。大多数观察值落在图形的中部,其
他的均匀分布在两边。例如人的身材,过于矮小和过于高大的人,在整个人
群中所占的比例极小;较为矮小和较高大的人占较大的比例;而中等身材的
人占最大的比例。所以,我们说,人的身材的比例分布基本上属于对称分布。
(2)偏斜分布
偏斜分布的图形如图 6—2所示。它是指大多数观察值分布在一边(或说
聚集在一边),而较少数处于另一边。它又有两种形态:一种是如图6—2
(a)所示的向下偏斜;另一种是图 6—2(b)所示的向上偏斜。例如,假定
两个群均以图6—2 的横轴代表收入水平,收入水平从低到高排列,假设两群
体中所拿最低收入相同,最高收入也相同。纵轴代表拿某种收入人数的话,
那么就可以看出,图 6—2(b)所代表的群体;比 6—2(a)所代表的群体要富
裕。
(3)双峰分布
这种图形的形状像驼峰,见图 6—3。它表明观察值形成为两个集中区
域。例如某班级考试的成绩,得较低分数和较高分数的人都较多,只有少数
人得中等分数,所以形成双峰分布。
… Page 138…
三、最主要的统计度量方法
总体中观察值的分布状况,可以用分布图很好地表现出来。另外还有一
些测度方法可以反映观察值的分布信息,它们包括:
集中趋势的度量
(1)平均值
平均值是所有观察值的和与观察值个数的比值。例如有 7个销售商(观察
值个数为 7),他们在6 月份各自销售的产品数量为1、9、10、12、13、17、
17,那么6 月份平均每人销售产品数为
1+9+10+12+13+17+17 79
= = 11。28(个)
7 7
如果我们是销售商的管理者,就会用他们 6 月份的平均人销售量同以前
的月份相比,看看是否具有某种趋势。平均销售量比总销售额更能反映销售
能力和盈利能力。因为有时销售总额高,并不表明销售人员干得好,而可能
是因为增加了销售人员的缘故。如果明年六月有 14个销售人员,比今年六月
多 1倍,而总销售额只比今年增长 50%,尽管销售收入增加了,但其盈利能
力实际却在下降。这说明有时平均值比总值更能反映问题的实质。但平均值
极易受极端值的影响。
(2)中位数
将所有观察值由低到高排序,处于中间位置的观察值即为中位数。中位
数是位置平均数,它把整个序列分成两半:一半比它小;另一半比它大。对
N+1
于奇数个观察值,中位数所在位置是 (N为观察值总数);对于偶数个观
2
察值,中位数的值等于中间位置两个观察值的平均值。如上例中,7 个销售
7+1
商销量的中位数所在位置是 =4,即销售1:2 个为中位数(1、9、10、
2
〔12〕、13、17、17——译者注)。
中位数的优点是不受极端值的影响。在上例中,有一个人6 月份仅销出
1件产品,远低于其他 6 人,属于极端值。中位数只考察观察值的位置,只
要中间项不变,其前后各项数值虽有变化,但中位数不变。所以,中位数同
平均值相比,掩盖了存在个人销量极低(即极端值——译者注)的事实。
究竟用平均值还是中位数作为平均数,视情况而定。如在上例中,一个
勇于迸取的管理者,在给销售人员下指标时,一般会倾向于选择使用中位数。
相反,如果那个销售人员不是销出 1件,而是销出35件产品,则管理者在他
给上司的报告中,就愿意使用平均值,以表明他所领导的部门的突出业绩。
因为此时,中位数仍是12个,而平均值则为:
35+ 9 + 10+ 12 + 13+ 17 + 17 113
= =16。6(个)
7 7
(3)众数
… Page 139…
众数是指在所有观察值中,出现次数最多的那个观察值。例如,在 7个
销售人员的销售记录中,17 出现了两次,则 17就是众数(1,9,10,12,13,
〔17〕, 〔17〕。如果观察值数列中各值皆不相同,也就没有众数。
众数有助于确定需优先考虑的事物和今后需加努力的重点。在市场战略
决策中经常要使用它。例如,为了最有效地利用有限的资金,皮鞋厂在生产
皮鞋时,需要了解各种尺码鞋的需求量,以决定生产什么尺码及生产的数量,
这时,就需要用众数,而不是平均值。
集中趋势需采用何种平均数度量,要视现象的分布及特点而定。
离散趋势的度量
(1)极差
极差是最粗略的离散程度度量方法,是指观察值中最大值与最小值之
差。我们仍用前述销售人员的例子,最大、最小销量分别是 17和 1,则极差
为 17-1=16。
极差是计量离差的简便方法,它由两个极端值来决定,所以容易受到极
端值变化的影响,而与中间数值的分布无关。因而它不能充分地反映现象的
实际差异。
(2)标准差
标准差是计量离散趋势最重要、也是最常用的指标。它反映了各个观察
值偏离平均值的程度。其计算公式为:
A(X … x )2
标准差 =
N
式中:x =平均值
X=实际观察值
N=观察对象的个数
此公式用于计算总体标准差,在计算随机样本的标准差时,公式中要以
N—1来代替N,这样,样本标准差才是总体标准差的无偏估计。
标准差计算示例(1)
我们仍用前面的例子,共有 7个销售商,各人销量分别为:1,9, 10,
12,13,17,17,平均值为11。28。那么标准差的计算过程如下表6—1所示。
表 6—1
… Page 140…
2
x x
(X) ( ) (X… )
第一位销售商卖了 1件产品 1…11。28 =…10。28 平方后= 105。68
二 9 9…11。28 =…2。28 平方后= 5。2
三 10 10…11。28 =…1。28 平方后= 1。64
四 12 12…11。28 =0。72 平方后= 0。52?
五 13 13…11。28 =1。72 平方后= 2。96
六 17 17…11。28 =5。72 平方后= 32。72
七 17 17…11。28 =5。72 平方后= 32。72
N— 7 181。44
A(X … x)2 181。44
= = 25。92 = 5。09
N 7
经过上述计算,标准差为5。09。
一般来说。计算标准差比较复杂,在数据很多的情况下,没有人用手工
计算。在所有MBA 教程中的数学公式,都可用计算机计算,你只要输入原始
数据就行了。
中心极限定理
为评价标准差指标的价值,我们首先应当了解它在中心极限定理中的意
义。(中心极限定理:对于任意一个平均数为μ标准差为σ的总体进行随机抽
样时,随着样本量 N 的增大,样本平均数x 就趋向子正态分布,其平均数为
x ,山标准差为σ/ n 。中心极限定理说明无论是从正态分布总体,还是从
非正态分布总体中抽样,只要样本容易足够大,其样本平均数也趋向正态分
布——译者注)请记住以下的叙述:
(1)无论任何分布(正态的或是其他的),其样本平均值都非常接近总体平
均值。
(2)为了对总体有代表性,样本量至少为30。
(3)在所有观察对象中(见图 6—4):
34%落在平均值上方第一个 “部分”内;
34%落在平均值下方第一个 “部分”内;
13%落在平均值上方第二个 “部分”内;
13%落在平均值下方第二个 “部分”内;
3%落在平均值上方第三个 “部分”内;
3%落在平均值下方第三个 “部分”内。
(4)上面所指的 “部分”,就是标准差。
如果你是一位经理,管理着 100位销售人员,他们人均年销售量为 100
件产品,标准差为 5(不用5。09 是为了方便计算),你会得到如下结果:
34位(占34%)销售人员卖出 75~80件产品;
34位(占34%)销售人员卖出 70~75件产品;
… Page 141…
图 6—4 标准正态分布
13位(占13%)销售人员卖出80~85件产品;
13位(占13%)销售人员卖出65~70件产品;
3位(占3%)销售人员卖的产品超过85件;
3位(占3%)销售人员卖的产品少于65件。
注意:在图6—4 中,除两端以外,每个 “部分”代表5件产品(即标准
差——译者注)。
由于94 位销售人员(占 94%)落在平均值旁边两个标准差的范围内,即
销量大于65件而小于 85件,我们就可以说,各销售人员之间销量的变动不
大,数据的离散程度低。
标准差示例 〔2〕:
对证券管理者和投资顾问来说,标准差是一个重要的指标。假定一位投
资者在权衡两个投资方案哪个可行。这两个方案平均获利水平相似,但一个
的标准差小,而另一个标准差大。那么,标准差大的方案风险也大。对于一
个仅有固定的有限收入的投资者来说,他
小提示:按 回车 [Enter] 键 返回书目,按 ← 键 返回上一页, 按 → 键 进入下一页。
赞一下
添加书签加入书架