论文发表
挖掘数据流任意滑动时间窗口内频繁模式
作者 |
李国徽 陈辉 |
期刊 |
|
期刊名称:软件学报 |
出版日期:2008, 19 (10) |
所在页数:2585-2596 |
摘要 |
由于数据流的流动性与连续性,数据流所蕴含的知识会随着时间的推 移而发生变化.因此,在绝大多数数据流的应用中,用户往往对新产生的流数据所包含的知识要比对历史流数据所包含的知识感兴趣得多.提出了一种挖掘数据流任 意大小滑动时间窗口内频繁模式的方法MSW(mining sliding window).当数据流流过时,该方法使用滑动窗口树SW-tree在单遍扫描流数据的条件下及时捕获数据流上最新的模式信息.同时,该方法还周期性地 删除滑动窗口树上过期的及不频繁的模式分支,从而降低滑动窗口树的空间复杂度与维护代价.此外,该方法还应用时间衰减模型逐步降低历史事务模式支持数的权 重,并由此来区分最近产生事务与历史事务的模式.大量仿真实验的结果表明,算法MSW具有较高的效率与优良的可扩展性,同时也优于其他同类算法. |
关键词 |
数据流 / 频繁模式挖掘 / 滑动时间窗口 / 时间衰减模型 |
|
|
|