合肥工业大学管理学院电子政务研究所 作品数:22 被引量:115 H指数:6 相关作者: 林文龙 焦宁 余智学 彭学仕 奚冬芹 更多>> 发文基金: 国家自然科学基金 国家教育部博士点基金 教育部人文社会科学研究基金 更多>> 相关领域: 自动化与计算机技术 经济管理 文化科学 理学 更多>>
Web浏览预测的Markov模型综述 被引量:9 2008年 Web访问模式挖掘研究的一个重要议题是Web浏览预测,Markov模型是一种经典的Web浏览预测模型。本文首先介绍了基本Markov浏览预测模型,包括基本Markov浏览行为模型,模型的学习训练及其在Web浏览预测问题中的应用;然后重点分析了扩展的Markov浏览预测模型,包括一序组合预测模型、高序模型、混合模型、隐Mark-ov模型、连续时间Markov模型等,综述了各种扩展模型所考虑的浏览预测问题的本质出发点、模型的学习方法及预测方法,最后分析了Markov浏览预测模型有待进一步研究的问题。 林文龙 刘业政 姜元春关键词:MARKOV模型 基于关联规则和协同过滤的网络商品捆绑方法研究 被引量:3 2009年 随着电子商务的发展,捆绑销售这种营销策略被逐渐应用于网站之中。本文将数据挖掘技术应用于商品捆绑,经过对数据的预处理,阐述如何利用关联规则实现对商品的捆绑,再通过协同过滤技术定位捆绑商品并向目标用户进行推荐。最后建立一个商品捆绑推荐系统体系结构以体现整个方法流程。 裘立波 姜元春 林文龙关键词:数据预处理 关联规则 协同过滤 WEB站点结构优化仿真 被引量:8 2007年 WEB站点结构优化技术是解决WWW浏览中搜寻与获取有益信息的困难问题及信息搜寻行为的效率低下问题的有效方法。基于WEB站点的超链体系结构特征与网页节点的访问频度值特征,建立了一种站点结构优化的数学模型,其目标是使整个站点具有较小的平均访问代价。分析了站点超链体系结构特征与节点访问频度特征,采用仿真算法分别模拟了WEB站点的超链体系结构与页面节点的访问频度值,并通过量化新增超链接的影响因素设计了相应的站点结构优化方法。实验结果表明:优化后的站点结构具有较小的平均访问代价。 刘业政 林文龙 焦宁 姜元春基于Markov与PageRank算法的Web日志仿真器 被引量:1 2008年 获取可靠的Web访问会话数据是Web使用挖掘(WUM)的重要前提,而很多时候这种数据不容易得到。据此,采用数学建模的方法,设计并实现了一个Web日志仿真器(SSPM,Session Simulator based on PageRank and Markov)。SSPM用Markov链过程模拟用户访问过程,将用户Web访问过程抽象为Markov链,以PageRank算法计算页面重要度,并以此计算Markov初始状态和转移矩阵,获取用户仿真日志。还介绍了SSPM的验证方法。 余智学 林文龙关键词:WEB使用挖掘 马尔可夫链 PAGERANK算法 基于隐马尔可夫模型的电子商务网站结构优化 被引量:3 2009年 针对电子商务网站中部分商品页面不处于用户预期位置,导致用户访问代价较大的情况,提出一种使用隐马尔可夫模型对网站结构进行优化建模的方法。首先建立一个隐马尔可夫模型用于模拟用户带有目的(表现为某种目标商品)的访问过程,再使用该模型挖掘出用户隐藏在访问序列中的目的,最后通过新增超链接实现网站结构优化。实验证明用该方法解决网站结构优化问题具备一定的可行性和有效性。 奚冬芹 林文龙 竺炯林关键词:隐马尔可夫模型 网站结构优化 粗糙集理论的研究进展和发展方向 粗糙集理论是一种新型的处理模糊和不确定性知识的数学工具,其主要思想就是在保持分类能力不变的前提下,通过知识约简,导出问题的决策或分类规则.总结了粗糙集理论研究的最新进展,包括粗糙集模型的推广,连续属性离散化,粗糙集理论有... 郭春根 潘永刚关键词:粗糙集 属性约简 不完备信息系统 知识约简 文献传递 可变多阶Markov链模型及在WWW个性化推荐中的应用 被引量:3 2008年 WWW个性化推荐问题是WEB挖掘的一个重要研究方向。针对传统的固定阶数的Markov链模型用于WWW个性化推荐问题的不足,提出可变多阶Markov链模型(Variable Multiple Order Markov Chairr--VMOMC)。VMOMC将用推荐目标网页概率值度量的可变多阶Markov链并行组合,组合模型中采用遗传算法确定各单阶Markov链模型的最优权重,在真实WWW站点访问日志数据上的实验结果表明:VMOMC与传统的定阶Markov链浏览推荐模型相比,具有较理想的推荐性能。 刘业政 林文龙 姜元春关键词:WEB使用挖掘 MARKOV链模型 个性化推荐 基于混合隐Markov链浏览模型的WEB用户聚类与个性化推荐 被引量:3 2009年 针对传统的Markov链模型不能有效的表征长串访问序列所蕴含的丰富的用户行为特征(用户类别特征、访问兴趣迁移特征)的缺点,提出混合隐Markov链浏览模型。混合隐Markov链模型使用多个不同的模型来区分不同类别用户的浏览特征,并为每个类别的用户设置了能跟踪捕捉其访问兴趣变化的类隐Markov链模型,能更好地对WWW长串访问序列的复杂特征进行建模,在真实WWW站点访问日志数据上的用户聚类实验与个性化推荐实验的结果表明,混合隐Markov链模型与传统的Markov链模型相比,具有更理想的聚类性能和推荐性能。 林文龙 刘业政 朱庆生 奚冬芹关键词:WEB使用挖掘 用户聚类 个性化推荐 基于兴趣文档集合游历便利性的站点结构优化模型 2008年 基于特定信息需求的网站用户游历其兴趣文档集合的便利性,建立了一种站点结构优化的数学模型,通过页组支持度与页组拓扑平均距离量化评估与挖掘站点中访问效率较低的内容文档集合为结构优化的兴趣页组,据此提出能综合评价站点访问效率的指标——WEB拓扑兴趣度,并通过分析新增超链接的影响因素设计了相应的站点结构优化方法,优化算法中采用遗传算法寻找最优组合的新增超链接组。实验结果表明:优化后的站点结构能有效改善信息搜索与获取行为的效率低下问题。 林文龙 刘业政 余智学 姜元春关键词:WEB使用挖掘 页面聚类 自适应站点 遗传算法 连续属性离散化算法比较研究 被引量:34 2007年 探讨了贪心及其改进算法、基于属性重要性、基于信息熵和基于聚类四类连续属性离散化算法,并通过实验验证这四类算法的离散化效果。实验结果表明,数据集离散化的效果不仅取决于使用算法,而且与数据集连续属性的分布和决策数据值的分类也有密切关系。 刘业政 焦宁 姜元春关键词:离散化 贪心算法 信息熵 聚类