基于SVM方法的大肠癌淋巴结转移预测——张钰 刘颂 胡珊等

获得积分
资料库会员登录
搜索: [高级搜索]
下载首页 | 资源分类 | 下载排行
您的位置: 首页 > 医疗CIO百宝箱 > 医院信息化经验
 
分类导航
下载排行
最新资源
基于SVM方法的大肠癌淋巴结转移预测——张钰 刘颂 胡珊等
资源大小:133.17 KB 资源类型:文档
下载积分: 0
更多
-->
下载统计:总下载:0,本月下载:0,本周下载:0,今日下载:0
发表评论 错误报告 加入收藏夹
资源介绍
基于SVM方法的大肠癌淋巴结转移预测
张钰① 刘颂① 胡珊① 丁培荣②
①中山大学中山医学院生物医学工程系,510080,广州市中山二路74 号
②中山大学附属肿瘤医院结直肠科,510060,广州市东山区东风东路651 号
摘 要 本文收集了1000 多例大肠癌病人的临床数据,运用支持向量机的算法对病人淋巴
结是否转移进行分类预测,用交叉验证的的方法得出最佳参数,预测准确率为82.65%.
关键词 支持向量机 数据挖掘 交叉验证
1 引言
淋巴结转移是影响大肠癌预后最重要的因素之一,因此准确地判断淋巴结转
移与否对于判断预后、制定治疗方案意义重大[1]。目前诊断淋巴结转移的“金标
准”是病理组织学检查,然而它会受到一些因素的影响,如淋巴清扫范围、取检
淋巴结的方法、淋巴结微转移的客观存在等。事实上,一些病理分期为早期的病
人出现了预后差的情况,可能与我们没有发现存在的淋巴结转移灶有关。
本文尝试建立淋巴结转移预测的计算机模型,能够为临床手术方案的制
定提供一定的参考依据。共收集了中山大学附属肿瘤医院一千多例结直肠
癌病人的数据,在对数据进行净化、去噪声、离散化等预处理后,利用支持向
量机软件libsvm(台湾大学林智仁副教授等研发)对大肠癌N 分期进行预测。
2 基本原理
支持向量机(SVM)是一种新型的机器学习方法,它是建立在统计学习理论
的vc(Vapnik Chervonenks)维理论和结构风险最小化(Structural RiskMinimi
zation,SRM)原理基础上的,即是由有限训练样本得到的决策规则对独立的测试
集仍能得到小的误差,这使得 SVM 方法 比基于经验风险最小化(Empirical Ri
sk Minimization,E1)的人工神经网络ANN 等方法具有更好的泛化能力和分类精
确性。支持向量机能较好地解决小样本、非线性、高维数和局部极小点等实际问
题,目前已成为机器学习界研究的热点。虽然 SVM 方法在理论上具有突出的优
势,但应用研究相对于理论研究较为滞后。SVM 的基本思想是对于非线性可分样
本 ,将其输入向量通过非线性变换映射到另一个高维空间,使其线性可分,在
这个新空间中寻找一个最优分类超平面,使得超平面与不同类样本集之间的距离
最大,从而达到最大的泛化能力。SVM 的这种非线性变换是通过核函数计算高维
空间中的内积实现的,这样就避免了维数升高而引起的计算困难[2],其基本原理
如下:考虑一个线性可分的二分类问题,设线性可分的个训练样本集{( , ),
i:1,2,…l,},输入样本空间的维数为d,每个样本属于标记为 ∈{-1,
1}的两类之一。由这一组样本可以确定一个分类超平面,使得离它
最近的每类点(称为支持向量)与它的距离达到最大值,对于每个样本有 :
≥ 1 (1)
样本到超平面的距离,即分类间隔,可定义为,当最小时,分类间隔最
大,此时的分离超平面即为最优分类面。使分类间隔最大实际上就是对推广能力
的控制,统计学理论表明[3]最优分类面具有最好的推广能力。
考虑到训练样本集为线性不可分时,需引入非负松弛变量,i=1,2,…,l,
上述最优超平面的求解问题为:
(2)
其中,惩罚参数C>0,C 越大表示对错误分类的惩罚越大。式(2)中第一项
使分类间隔尽量大,第二项则使误差尽量小
下载地址
 下载地址1
按字母检索

下载须知:
大部份资源无需注册即可下载
需要积分的资源要在会员中心注册会员并用 积分体系中提示的方法赚取积分才能下载。

免责声明:
所有资源只能用于参考学习,不能用于任何商业用途,否则后果自负!