标题:分布式多数据流频繁伴随模式挖掘
作者:于自强;禹晓辉;董吉文;王琳
作者机构:[]济南大学信息科学与工程学院,山东济南250022,中国.;[]山东大学计算机科学与技术学院,山东济南250101,中国
通讯作者:Wang, Lin
通讯作者地址:[Wang, L] School of Information Science and Engineering, University of Ji'nanChina;
来源:软件学报
出版年:2019
卷:30
期:4
页码:1078-1093
DOI:10.13328/j.cnki.jos.005419
关键词:[525225]多数据流;频繁伴随模式;分布式挖掘算法;
摘要:多数据流频繁伴随模式是指一组对象较短时间内在同一个数据流上伴随出现,并在之后一段时间以同样方式出现在其他多个数据流上.现实生活中,城市交通监控系统中的伴随车辆发现、基于签到数据的伴随人群发现、基于社交网络数据中的高频伴随词组发现热点事件等应用都可以归结为多数据流频繁伴随模式发现问题.由于数据流规模巨大且到达速度快,基于单机的集中式挖掘算法受到硬件资源的限制难以及时发现海量数据流中出现的频繁伴随模式.为此,提出面向大规模数据流频繁伴随模式发现的分布式挖掘算法.该算法首先将每个数据流划分成若干个segment片段,然后构建适合部署在分布式计算平台上的多层挖掘模型,并利用多计算节点以并行方式对大规模数据流进行处理,从而实时发现频繁伴随模式.最后,在真实数据集上进行充分实验以验证算法性能.
收录类别:EI;CSCD;SCOPUS
资源类型:期刊论文
原文链接:https://www.scopus.com/inward/record.uri?eid=2-s2.0-85073662103&doi=10.13328%2fj.cnki.jos.005419&partnerID=40&md5=f680418bb31d9157a94ad0392000a223
TOP