12. 逆高斯模型¶
逆高斯(inverse Gaussian)模型是所有传统GLM中最不常用的模型, 虽然在GLM家族谱中总能看到逆高斯模型, 但是实际当中却很少使用和讨论。 尽管如此,本书还是单独列出一张讨论逆高斯模型,帮助读者学习和研究。
12.1. 逆高斯分布¶
在统计学中,逆高斯分布(inverse Gaussian distribution),又叫 Wald distribution,
是拥有两个参数的连续值分布,其支持域是
其中
为了直观的了解到逆高斯分布的形状和特点,
我们看下在不同参数值情况下,逆高斯分布图形的差异,
首先我们假设

图 12.1.1
我们看到随着
现在我们固定

图 12.1.2
尽管分析师在对数据建模时很少使用此逆高斯模型,但有时它比其他连续模型更适合数据。
它特别适合于拟合正值连续数据,这些数据包含低值数据且右偏较长。 与Poisson分布混合以创建稍后讨论的Poisson逆高斯混合模型时,此功能也将非常有用。 see section 14.11.
为了说明未经调整的逆高斯密度函数的形状,我们创建了一组简单的Stata命令,以针对指定的均值和标度参数生成概率密度函数的值。 各种参数值的概率密度函数图显示了灵活性。
高斯分布的两个参数是
12.2. 逆高斯回归模型¶
。在GLM中,用
现在把上式转化成指数族的形式。
和GLM中指数族的标准形式对比下,不难得到各个组件的内容。
现在来看下逆高斯分布的期望和方差。
逆高斯分布的方差为:
显然逆高斯分布的方差是和其期望相关的。
根据标准连接函数的定义,逆高斯分布的标准连接函数为:
连接函数的导数为:
响应函数
总结一下逆高斯模型的关键部分。
12.3. 参数估计¶
12.3.1. 似然函数¶
逆高斯分布的指数形式去掉底数就得到了对数似然函数。
根据 公式(8.1.12) ,标准连接函数的Gamma模型的似然函数的一阶偏导为
我们发现逆高斯模型和高斯模型的得分统计量只差了一个负号。
12.3.2. IRLS¶
逆高斯模型的
12.3.3. 拟合优度¶
逆高斯模型的饱和模型的对数似然函数为
逆高斯模型的偏差统计量为
逆高斯模型的皮尔逊卡方统计量为
12.4. 其它连接函数¶
类似于伽玛模型,除了标准连接函数, 对数(log)连接函数和恒等(identity)连接函数是也是逆高斯分布经常使用的连接函数。
对于逆高斯,当对持续时间类型的数据进行建模时,恒等连接函数是另一个合适的选择。