标题:基于语义和结构的XML文档相似度的计算方法
作者:宋玲;吕强;邓薇;吕晓琳
作者机构:[宋玲] 山东大学控制科学与工程学院, 济南, 山东 250061, 中国.;[吕强] 国网技术学院电网检修培训部, 济南, 山东 250002, 中国.;[邓薇] 山东科技大学基础课部, 泰 更多
来源:中文信息学报
出版年:2012
卷:26
期:5
页码:59-64
关键词:XML相似度; 动态规划; 语义和结构
摘要:个性化信息服务通过了解用户的兴趣爱好,为不同的用户提供不同的信息服务。XML是一种标示语言,是Web文档表示和交换的常用相关标准,因此XML文档 之间相似度计算问题对于个性化推荐与信息检索非常重要,为此提出了一个计算XML文档之间的语义和结构相似度的方法XMLSim。首先,基于节点标记对之 间的语义相似度和编辑距离计算节点标记对之间的相似度;在分析了路径上节点具有的偏序关系之后,将路径之间相似度问题抽象为最大相似子序列(MSS,Ma ximal Similar Subsequence)问题,并利用动态规划对MSS问题求解得到路径相似度NpathSim。最后,XML文档之间的相似度XMLSim通过路径集合 之间的最大NPathSim的平均值得到。
收录类别:CSCD
资源类型:期刊论文
原文链接:http://kns.cnki.net/kns/detail/detail.aspx?FileName=MESS201205011&DbName=CJFQ2012
TOP