超强的作者数-44位-中国科学上一篇文章
中国科学B辑:化学 2007 37 (006): 592-596
支持向量机和线性判别分析用于禽流感病毒编码蛋白识别
梁桂兆①②③, 陈泽聪①②, 杨善彬②③, 梅虎②③, 周原②③, 舒茂①②, 杨力①③,
杨胜喜①②, 郑小林②③, 陈国华①②, 周鹏①②, 田菲菲①②, 廖春阳①②, 吴世容①
②, 李根容①②, 李德静①②, 何留①②, 甘孟瑜①②, 高剑坤①②③, 陈国平①③, 王
贵学②③, 龙莎①②, 景举华①②, 曾晖①②, 张巧霞①②, 张梦军①②③, 杨娟①②③
, 仝建波①②, 王娇娜①②, 刘永红①②, 李波①, 仇亮加①, 蔡绍皙①③, 赵娜①②,
杨艳①②, 苏霞利①②, 宋健②, 陈美霞②, 陈刚①④, 张雪姣①②, 孙家英①②, 李经
纬①②, 邓婕①②, 彭传友①②
① 重庆大学化学化工学院, 生物医学工程重庆市重点实验室, 重庆 400044;
② 湖南大学化学生物传感与计量学国家重点实验室, 长沙 410012;
③ 重庆大学生物工程学院, 生物力学与组织工程教育部重点实验室, 重庆 400030;
④ 新加坡国立技术学院生命科学技术中心, 新加坡 139651
收稿日期 2005-11-27 修回日期 网络版发布日期 接受日期 2006-3-13
摘要 以支持向量机(SVM)和线性判别分析(LDA)对200条禽流感病毒、100条B型流感和10
0条C型流感病毒蛋白共400条为训练集样本, 从表征序列的200个整体与局部变量中以逐步
(stepwise)方法选取24个变量作为LDA模型的输入建立线性识别模型, 病毒蛋白总识别率达
99.8%, 留一法交互检验总识别率为99.4%. 从原始200变量中经主成分分析得16个主成分
作为SVM的输入, 以径向基核函数(RBF)SVM建立非线性识别模型, 病毒蛋白总识别率为99.
8%, 留一法交互检验总识别率为99.2%. 以100条禽流感、50条B型流感和50条C型流感病毒
编码蛋白质共200条为测试集样本, 得LDA模型, 对其总识别正确率为95.4%, SVM模型对其
总识别正确率为96.5%. 识别结果表明, 两个模型都可较好识别禽流感病毒蛋白, 并且SVM
对禽流感病毒蛋白的识别结果优于LDA.Sample Text中国科学B辑:化学 2007 37 (006)
迄今为止我见到过的作者人数最多的