魏文晗
- 作品数:3 被引量:40H指数:2
- 供职机构:重庆大学计算机学院更多>>
- 发文基金:重庆市自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于局部变化性的网页篡改识别模型及方法被引量:4
- 2013年
- 针对传统的网页远程监控方式局限于静态网页的问题,提出一种适用于动态网页的基于规则的分类模型。该模型考虑到网页的局部变化性,首先根据历史页面的动态更新,划分网页的动态区域和静态区域;其次,对动态区域,根据历史特征计算相关阈值,对静态区域建立分块的MD5历史库;最后,根据定义的IF-THEN规则决定是否发送警报。实验表明,该模型能在更短时间内完成全站检测,对正常页面的误报率较低,对异常页面的检测率较高。
- 魏文晗邓一贵
- 关键词:网页篡改网站监测篡改检测领域知识
- 网页篡改检测系统的研究与实现
- 随着互联网的发展和网民数量的快速增长,越来越多政府、学校、企事业单位的业务都依托于网站。与此同时,由于各类Web应用系统的复杂性和多样性,特别是缺乏必要的安全性维护,网页篡改事件时有发生。这样不仅破坏了网站所有者的声誉,...
- 魏文晗
- 关键词:网页篡改
- 基于隐含语义分析的微博话题发现方法被引量:36
- 2014年
- 随着微博的大量普及和关注度的不断提高,微博热点话题发现已成为当前研究热点。针对于短文本、向量空间模型(VSM)文本表示方法存在高维度、稀疏,以及同义多义问题,导致难以准确度量文本相似度,提出一种基于隐含语义分析的两阶段聚类话题发现方法。引入话题热度的概念来选取具有一定关注度的微博文本,用隐含语义分析(LSA)对数据集进行建模;用层次聚类的CURE算法确定初始类中心;用K-means聚类得到热点话题的聚类结果。真实微博数据集的实验结果验证了该方法的有效性。
- 马雯雯魏文晗邓一贵
- 关键词:隐含语义分析向量空间模型LATENTSEMANTIC