标题:代谢组学数据正态性对疾病分类准确性的影响
作者:公晓云;申小涛;徐静;张涛;朱正江;薛付忠;
作者机构:[公晓云;申小涛;徐静;张涛;朱正江;薛付忠]山东大学公共卫生学院生物统计学系;[公晓云;申小涛;徐静;张涛;朱正江;薛付忠]中国科学院上海有机化学研究所生物与化学交 更多
来源:山东大学学报(医学版)
出版年:2016
期:04
页码:89-93
关键词:数据正态性;分类准确率;Bayes判别;Fisher判别;偏最小二乘判别分析;随机森林;支持向量机
摘要:目的探讨在代谢组学数据中服从正态分布的变量个数逐步增加时统计分类方法分类准确率的变化趋势。方法首先模拟产生11组代谢数据,且数据中服从正态分布的变量逐渐增加,然后用传统的非机器学习统计方法[Bayes判别、Fisher判别、偏最小二乘判别分析(PLS-DA)]和机器学习方法[随机森林(RF)、支持向量机(SVM)]进行统计分析,比较分类准确率的变化;最后用两个实例分析对模拟结果的合理性进行评价。结果代谢组学数据正态性对Bayes判别、Fisher判别、PLS-DA的分析结果影响较大,随着数据中服从正态分布的变量个数增加,分类准确率增大,而对RF和SVM基本没有影响。结论传统的非机器学习方法在统...
资源类型:期刊论文
原文链接:http://kns.cnki.net/kns/detail/detail.aspx?FileName=SDYB201604020&DbName=CJFQ2016
TOP