利用申康实际数据,用计算机模拟专家思维方式的标准化分型,实现所有申康病例的病例分型。
模型应用:先判断病例为手术组还是非手术组,再将病例其他特征值代入所属组的函数方程,计算出4个P值,哪个P值最大,就属于哪种分型。
主要缺点:与专家“四型三线”分型的思维方式不完全符合,对病情是单纯型,还是复合型未作考虑,仍有较大分型误差
算法选择:进行训练数据分布特征的描述,根据数据分布选择合适的回归方法(线性回归、岭回归、主成因回归、Logistic回归?)。
模拟检验:根据专家确定的病例分型、筛选的关键变量X,利用训练数据和选定的回归分析方法,进行12个函数方程的模拟,并进行检验。
回归诊断:为提高模型拟合优度,避免参数估计偏差,进行回归诊断,包括检测异常点(严重偏离既定模型,即残差较其他各点大得多的点)、高扛杆点(远离设计中心的点)和强影响点(对既定模型有较大影响的点)。
|
|