Poisson回归模型

时间:2023-04-28 12:23:16 阅读: 最新文章 文档下载
说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。
Poisson回归模型也是用来分析列联表和分类数据的一种方法,它实际上也是对数线性模型的一种,不同点是对数线性模型假定频数分布为多项式分布,而泊松回归模型假定频数分布为泊松分布。 首先我们来认识一下泊松分布: 一、泊松分布的概念和实际意义:

我们知道二项分布是离散型概率分布中最重要的一种,而二项分布的极限形式就是泊松分布(P很小,n很大),也是非常重要的一种离 散型概率分布,现实世界中许多偶然现象都可以用泊松分布来描述。

泊松分布认为:如果某些现象的发生概率p很小,而样本例数n又很大,则二项分布逼近泊松分布。因此泊松分布是由二项分布推导 出的,具体推导过程如下:






因此泊松分布的概率函数就为





如果一个随机变量x取值为k的概率符合上述公式,则称x服从参数为λ的泊松分布

我们结合二项分布来解释一下推导过程:

如果做一件事情成功的概率是p的话,那么独立尝试做这件事情n次,成功次数的分布就符合二项分布。在做的n次试验中,成功次数 有可能是0次,1次,2...n次,每一次试验成功的概率是p,不成功的概率是1-p,成功k次的试验可以任意分布在总共的n次试验中,把它们相乘就是恰好成功k次的概率,也就是上面的



那么我们接着考虑:在一个特定时间内,某件事会在任意时刻随机发生。当我们 这个时间段分割成非常小的n个时间片(n—+∞)并做如下假定:

1.每个时间片内事件发生是独立的,和前后是否发生无关,也就相当于是独立试验。

2.由于n—+∞,那么在1/n这么小的一个时间片内,某个事件发生两次或更多是不可能的。

3.每个时间片内该事件发生的概率p与时间片个数n的乘积n*p=λ,为一常数,这个常数表示了该事件在这个时间段内发生的频度,或称为总体均值、总体发生数等,也就是上面的令p=λ/n

结合以上解释,我们可以了解由二项分布推导出泊松分布的思想,如果用概率论的语言来解释泊松分布,可以描述为:如果某事件 的总体发生次数为λ,那么n个独立试验中,该事件发生k次的概率分布。

泊松分布可以看做是二项分布的一种特例,对于n很大而p很小的试验,使用二项分布计算十分麻烦,此时可简化为泊松分布进行计算,并且泊松分布非常适合于描述单位时间内随机事件发生次数的概率分布,它将发生次数这种原本离散的数据,和时间结合起来,从而形成了一种类似连续性的概率分布,而二项分布主要是研究n个离散事件的概率分布。


本文来源:https://www.wddqw.com/doc/6d420318905f804d2b160b4e767f5acfa1c783e0.html