用SIMCA法在预测准确率集中的分类准确率比在...

您所在位置: &
 &  & 
癌症傅里叶变换红外光谱分析的研究进展.pdf9页
本文档一共被下载:
次 ,您可免费全文在线阅读后下载本文档
文档加载中...广告还剩秒
需要金币:150 &&
你可能关注的文档:
??????????
??????????
第"" 卷! 第" 期
川 北 医 学 院 学 报
789: "" ,*8: "
"##$ 年% 月
*+, ’- *’ ./ 012/ +* 34512+, 2’,,464
癌症的傅里叶变换红外光谱分析研究进展
(川北医学院化学教研室,四川 南充
摘! 要:癌变组织和细胞与正常组织和细胞在分子水平上相比具有一些规律性的差异,主要包括:癌变组织中核酸含量增
加、糖原含量下降、氨基酸残基2A’/ 基团的结合氢键大部分遭到破坏、脂质的亚甲基链趋向无序等。应用傅里叶变换红外光
)能将癌变组织和细胞分子水平上组成或结构的变化通过其红外谱图相关谱学参数的变化体现出来,从而提示我
们可以利用-.1
法作为一种定量化鉴别癌症的手段。
关键词:傅里叶变换红外光谱;癌症;应用;进展
文章编号:
B##CA@ ?$ ("##$ )#"A#B$#A#@! 中图分类号:’%@D: "! 文献标识码:+
! ! 癌症是对人类危害极大的疾病之一,目前尚无
组织和细胞的这些大分子(核酸、糖原、蛋白质、脂
有效的治疗手段对其进行根治,因此,早期作出正
质等)所对应的特征吸收峰在谱型、强度、频率等谱
确的诊断对患者的治疗和痊愈具有重要的意义。目
学参数上与正常组织和细胞的红外谱图相比发生了
前,对癌症的诊断主要是依靠病理学诊断,但其过
相应的变化,傅里叶变换红外光谱仪能够准确地将
程较为烦琐,且易受人为因素影响;近年来的内窥
这些组织和细胞在分子水平上组成和结构的变化信
镜、影像学诊断技术和标记物诊断技术的发展和经
息转换为相应的含有光谱信息的信号,
正在加载中,请稍后...2741人阅读
数据挖掘(42)
对样本空间 D 进行 放回抽样,得到样本空间的一个子集 Di,由Di得到一个 分类器Mi。
不断的重复上述过程,就可以得到一系列分类器 M1,M2,M3....Mi ,在分类时用这些分类器进行投票来决定分类。
在R语言中装袋的函数存在于ipred (Improved Predictors)package中。
二、提升和AdaBoost
对长度为d(样本数为d)的训练样本空间 D 的每一个元组(每个样本)分配一个初始的权限 1/d, 然后开始一个迭代的过程:
根据元组的权限来作为抽取概率进行放回抽样,抽样出的样本的长度也必须为 Di,根据 Di 生成一个分类器 Mi。
使用 Mi 对 D进行分类,找出分类错误的元组,把这些元组的权重累加,得到该分类器的错误率 Ei
如果Ei大于0.5,舍弃 Mi。
如果Ei小于0.5,则调整那些被正确分类的元组,将其权重 乘以 Ei/(1-Ei),由于Ei小于0.5,所以正确分类的元组实际上权重被降低了。
从上面的过程得到 i 个分类器,在使用的过程中每个分类器有一个投票的权重,其值为 log2((1-Ei)/Ei)。
AdaBoost会给每个样本定一个权值,这是很少见的,在R中实现AdaBoost的package叫“boost”。
三、随机森林
在装袋的基础上,在样本的维度上也采用随机选择的技术(或者随机选择的维度线性组合),得到众多的分类器,仿佛一片森林。
R中有“randomForest” package实现了这个算法。
四、样本不平衡时的解决办法
当样本中不同类别的元组数量差距很大时(比如类别A的元组有100个,而类别B的元组有10000个),可以采用一下方法提高分类准确度:
过抽样:在采样的时候把稀有类别的元组多复制几份放到样本中去
欠抽样:在采样的时候把多数类别的元组随机从样本中移除
阈值移动:分类器不再返回一个具体的类别,而是返回一个[-1,1]的数字,设定一个阈值X,当返回的数字大于X时,相当于分在了A类,反之分在了B类。
参考知识库
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
访问:584288次
积分:7717
积分:7717
排名:第2483名
原创:207篇
转载:36篇
评论:68条
(4)(14)(1)(1)(3)(3)(2)(4)(2)(3)(2)(2)(3)(5)(2)(1)(2)(1)(1)(2)(1)(3)(1)(1)(4)(3)(1)(1)(1)(3)(21)(12)(8)(3)(11)(12)(6)(4)(5)(3)(2)(2)(2)(7)(6)(2)(5)(6)(4)(9)(7)(4)(6)(9)(12)(1)

参考资料

 

随机推荐