预测概率
由于模型尝试预测累积概率而不是类别成员资格,因此需要执行两个步骤来获取预测类别。 首先,对于每个个案,必须为每个类别估算概率。 其次,这些概率必须用于为每个个案选择最可能的结果类别。
概率本身是通过在模型方程中使用个案的预测变量值并采用关联函数的逆函数来估计的。 结果是每个组的累积概率,条件是观测值的预测变量值的模式。 然后,可以通过按顺序获取组的累积概率的差异来派生各个类别的概率。 换言之,第一类的概率是第一累积概率; 第二类的概率是第二累积概率减去第一; 第三类的概率是第三累积概率减去第二; 依此类推。
从概率到预测类别值
对于每个个案,根据该个案的预测变量值的模式,预测结果类别只是具有最高概率的类别。 例如,假设您有一个申请人需要 48 个月的贷款 (duration) , 22 岁 (age) ,银行有一个信用 (numcred) ,没有其他分期付款债务 (othnstal) ,并拥有她的住宅 (housng)。 将这些值插入到预测方程中,此申请人的预测值为 -2.78, -1.95, 0.63和 0.97。 (请记住,除了最后一个类别外,每个类别都有一个方程式。) 采用互补双对数关联函数的逆函数给出了累积概率 .06 , 0.13, 0.85和 0.93 (当然,最后一个类别为 1.0 )。 取差给出以下个别类别概率: 类别 1: .06 ,类别 2: 0.13-0.06=0.07,类别 3: 0.85-0.13=0.72,类别 4: 0.93-0.85=0.08,类别 5: 1.0-0.93=0.07。 显然,根据模型,类别 3 (当前债务支付) 是此案例最有可能的类别,预测概率为 0.72。 因此,您将预测此申请人将使其付款保持在当前状态,并且该帐户不会变得至关重要。
NEXT