文章插图
对频率分布中存在的“长尾”现象的统计学研究可以追溯到1948年美国哈佛大学语言学教授齐普夫(George K. Zipf)对英文文献中单词词频的分析和研究工作 。齐普夫教授的研究成果指出,英语文献中单词的词频相对于序号的分布呈现一种幂函数分布,而不是正态分布(normal distribution) 。由此,词频分布定律又被称为齐普夫定律(Zipf’s law)[1] 。而这种幂函数分布,被称为“幂律”分布(power law distribution)[2] 。
在我们的日常生活中,正态分布是非常常见的 。比如,某一地区男性的身高,某一省的高考数学成绩,某一型号比特币矿机的平均使用寿命,等等 。正态分布是一种较为“平等”的分布,因为大部分人的状况都在平均值上下,彼此相差不会太多 。特别高的和特别低的,都是比较罕见的 。
但是同时,正态分布又是一种不太“公平”的分布 。比平均选手高出6个标准差的高手,在数学考试中,或者运动场上,几乎总是赢定那些平凡的无名之辈,让后者望尘莫及 。分数线一画,没过线的大多数人就惨遭淘汰 。克劳特的《定位》理论,说的就是人们对于一种产品只能记住第一名,最多还能再记住一个竞品和替代品,也就是第二名[3] 。而更多的平庸选手,则只会被市场遗忘 。
而幂律分布,则又是另外一幅景象 。像人们的收入水平,单词的词频,城市的人口,比特币矿工拥有的算力,等等 。幂律分布是一种较为“公平”的分布,虽然头部20%的选手占据了80%的市场,但是80%的长尾选手,仍然可以瓜分剩余20%的市场 。大佬吃肉,小弟喝汤 。
不过同时,幂律分布又是一种不太“平等”、两极分化的分布 。它有一个通俗的说法叫做“二八法则”(80/20 rule) 。20%的产品贡献了80%的收入,20%的人赚走了80%的钱,花20%的时间就可以学到80分的水平(剩下20分的水平则需要花80%的时间才行),20%的美女被80%的男孩子追求,等等 。
意大利经济学家维尔弗雷多·帕累托(Vilfredo Pareto)在1896年研究社会收入和财富分布时发现了80/20的现象,后人将其理论命名为“帕累托法则”(Pareto principle)[4] 。帕累托在他的著作《政治经济学》(Cours d’économie politique)中指出了意大利大约80%的土地为20%的人所占有的现象 。
当然,帕累托的研究具有鲜明的时代特征,而不能视为绝对的自然法则和永恒真理 。在他做研究的时代,欧洲圈地运动已经成功驱逐和解放了农民,资本主义和工资工人阶级兴起,土地被集中占有并通过法律作为私产保护起来,形成了帕累托所观察到的现象 。这一现象,是那个时代社会运动的结果呈现 。
对于土地,也许应该像阳光、空气和水一样,又或者像一夫一妻制、一人一票制那样,实行强制平均分配,并立法禁止兼并(正如《刑法》之“重婚罪”所做的那样) 。因为平均分布,是比幂律分布更公平的分布 。人人平等,利益均分 。
二八法则的两极分化,特别是富人更富、穷人更穷的社会现象,还有一个说法叫做“马太效应”(Matthew effect)[5] 。马太效应,1968年由美国科学史研究者罗伯特·莫顿(Robert K. Merton)提出,借喻自圣经《新约·马太福音》:“凡有的,还要加倍给他叫他多余;没有的,连他所有的也要夺过来”,反映一种赢家通吃的现象 。
当我们谈论二八法则或者马太效应的时候,有一个潜台词就是,我们是在关注和强调头部,也就是把注意力和精力放在20%的市场和客户身上 。因为我们的精力和时间实在有限,所以需要聚焦于20%的头部,而忽视剩下的80%的长尾 。
以上关于本文的内容,仅作参考!温馨提示:如遇健康、疾病相关的问题,请您及时就医或请专业人士给予相关指导!
「四川龙网」www.sichuanlong.com小编还为您精选了以下内容,希望对您有所帮助:- 女人必知的相亲定律
- 超详解说剑网3计费形式 剑网3怎么收费标准
- 橄榄球分为哪两种形式,橄榄球的比赛规则?
- 户外减肥:爬山与快步走
- 免费分享两种设备连接教程 蓝牙功放怎么连接音响设备
- 两种款式实测效果对比 露华浓325和225哪个好看
- 解说2者区别与联系 无线ap和路由器的区别是什么
- 运动会入场式解说词
- 田径运动会入场式解说词
- 恒大集团两种结局 恒大地产新消息