标题:基于基序及其时序关系的多变量数据流分类研究
作者:张杰;赵峰;孙曰瑶;
作者机构:[张杰;赵峰;孙曰瑶]山东科技大学经济管理学院;[张杰;赵峰;孙曰瑶]山东大学经济学院
来源:情报杂志
出版年:2012
卷:31
期:09
页码:163-168
DOI:10.3969/j.issn.1002-1965.2012.09.031
关键词:基序;;时序;;多变量数据流;;长期频率;;逆文档频率
摘要:多变量数据流精确分类问题是当前数据挖掘与信息领域的热点和难点,引起国内外越来越多研究群体的关注,但以往的研究大多依赖于从单个流中提取特征并进行分类,没有考虑数据流内以及数据流间特征的相互依赖关系。基于此,借鉴生物信息学中基序查找的方法,提出了长期频率和逆文档频率的分类方法,该方法主要是将每个输入流都转化为符号序列来描述信号变化特征,并将符号分为长度不同的块,以便更有效地提取基序;通过计算基序的频率、长期频率与逆文档频率的权重,用以衡量不同输入多变量数据流的基序之间的时序关系,并利用了基序与时序关系实现了对多变量数据流的分类,从而确保了多变量数据流分类的准确性,仿真实验的结果也证明该方法的有效性...
收录类别:中文社会科学引文索引
资源类型:期刊论文
原文链接:http://kns.cnki.net/kns/detail/detail.aspx?FileName=QBZZ201209032&DbName=CJFQ2012
TOP