科学发现年龄定律的再探讨

2012-08-16 06:30周爱民
科技视界 2012年11期
关键词:概率分布布尔定律

周爱民

(郑州大学图书馆 河南 郑州 450002)

梁立明、 赵红洲已探讨过科学发现年龄定律。 他们探讨的科学发现年龄定律分析方法已作为经典方法进入了许多科学计量学书中。 为了探索出科学发现年龄符合威布尔分布,我们希望不作任何参数假定的情况下,得到威布尔分布的参数,为此我们从威布尔分布基本概念谈起。

1 威布尔分布基本概念

定义:若非负随机变量X 有分布函数

其中a、γ、k 均大于0,则称X(或F(x))有威布尔分布。设随机变量x 服从三参数威布尔分布,则其概率密度函数和累积概率分布函数为

其中,K>0 为形状参数,a>0 为尺度参数,γ≥0 为位置参数。

表1 1500-1960 年按世纪分期重大科学发现与年龄的统计数据

2 重大科学发现的年龄数据(表1)

3 数据处理

威布尔分布一般只给出时间, 即第一个数值产生的时间、第二个数值产生的时间、第三个数值产生的时间、…、第n个数值产生的时间。 但1500-1960 年按世纪分期重大科学发现与年龄的统计数据却是分组型数据,即每十岁间产生了多少重大科学发现,因此我们不能直接利用威布尔模型。 我们必须给出新的方法。 我们仅分析1601-1700 年期间的数据。由于此数据表给出的是岁数与发生的频率,而不是重大科学发现产生时的具体岁数,所以我们下面用威布尔累积概率分布函数来作为拟合模型。

威布尔模型中,F(x)表示累积概率。 显然我们可以把问题转化成:

F(20)-F(10)=0.05

F(30)-F(20)=0.28

F(40)-F(30)=0.26

F(50)-F(40)=0.24

F(60)-F(50)=0.09

F(70)-F(60)=0.08

为此我们定义一个新差函数

Φ(x)的值如表2。

表2 Φ(x)的值

显然这是一个一元非线性回归问题, 我们利用dps 软件中的一元非线性回归程序计算得:

R2=0.9077,拟合精度还可以。我们考虑到x>12.7164 则定义累积概率分布函数和概率密度函数为:

我们考虑到x>12.7164,计算区间概率值P,区间概率值P与差函数Φ(x)的拟合值(x)的唯一差别是第一个值不同,(x)中的]在x<12.7164 处取非0 值,而

在x<12.7164 处只能是0 值, 因此, 区间概率值P 在x<12.7164 处只能是0 值。 二者矛盾,因此,必须按定义的累积概率分布函数计算区间概率值P,得:

表3 计算结果分析

最大残差为3.3715。

4 分布检验

设数组数为k,各组频数为fi,总频数为n,那么有卡方

定理,若n 充分大,则不论总体服从什么分布,统计量

总是近似地服从自由度为k-r-1 的χ2分布。

其中r 是被估参数的个数,pi是被假定分布的概率(即计算出的概率),而不是原频率所决定的观察概率。 这个定理告诉我们,只要能通过卡方检验,就可以认为服从被假定的分布。

针对1601-1700 年期间的数据拟合结果,有

5 最佳发现年龄

最佳发现年龄的特点是成果增加最快, 成果增加最快处,累积函数

数量增加也最快,因此,该式的导数最大。 即

即:

化简后可写成下式:

解得:

我们把各个参数代入得:

x≈32.39

6 重大科学发现的年龄半衰期

我们令

利用DPS 软件求得

x=36.3089

即1601-1700 这个世纪完成世界上全部重大科学发现的一半年龄是36.3089 岁。

7 结语

从前边分析知: 重大科学发现年龄确实服从威布尔分布。 一般而言威布尔分布位置参数要小于自变量的最小值,但具体是多少,必须进行计算。

[1]程侃.寿命分布类与可靠性数学理论[M].科学出版社,1999:25-26.

[2]梁立明,赵红州.科学发现年龄定律是一种威布尔分布[J].自然辩证法通讯,1991(1).

猜你喜欢
概率分布布尔定律
离散型概率分布的ORB图像特征点误匹配剔除算法
倒霉定律
布尔和比利
布尔和比利
布尔和比利
布尔和比利
基于概率分布的PPP项目风险承担支出测算
依赖于时滞概率分布的不确定细胞神经网络的鲁棒稳定性
耐人寻味的定律
食堂定律