王桢文
- 作品数:9 被引量:14H指数:2
- 供职机构:国防科学技术大学更多>>
- 发文基金:国家自然科学基金湖南省自然科学基金国防科学技术大学优秀研究生创新基金更多>>
- 相关领域:自动化与计算机技术理学更多>>
- 基于概率生成模型的网络数据分类方法被引量:2
- 2013年
- 利用实体之间的相互关系来对实体进行分类的网络数据分类是数据挖掘的一个重要研究内容.现有的网络数据分类方法普遍根据邻居节点的类别来对节点进行分类.这些方法在同质性程度较高的网络中达到了很高的分类精度.然而在现实世界中,存在许多同质性程度很低的网络.在低同质性网络中,大多数相连节点的类别不同,所以现有方法难以正确预测出节点的类别.因此,提出了一种新的网络数据分类方法.其主要思路是建立一个描述网络的概率生成模型.在这个概率生成模型中,将网络中的边作为观察变量,将未知类别节点的类别作为潜在变量.通过吉布斯采样方法对模型进行求解,计算出潜在变量的取值,从而得到未知类别节点的类别.在真实数据集上的对比实验表明,提出的分类方法在低同质性网络上有更好的分类性能.
- 王桢文肖卫东谭文堂
- 关键词:网络数据同质性
- 一种面向网络论坛的意见领袖挖掘方法
- 本发明公开了一种面向网络论坛的意见领袖挖掘方法,包括意见领袖挖掘系统,意见领袖挖掘系统包括计算中心和数据库服务器,数据库服务器与计算中心通信,该方法的具体步骤为:利用爬虫抓取论坛数据,并利用消息中间件提高数据处理的实时性...
- 葛斌李芳芳汤大权蒋林承唐九阳王桢文胡升泽戴长华
- 文献传递
- 一种面向多文本集的部分比较性LDA模型被引量:5
- 2013年
- 跨时空、跨文化文本挖掘等比较性文本挖掘(comparative text mining,CTM)旨在从多个可比的文本集中发现各文本集隐含语义结构的异同.针对当前主要的CTM模型只能分析公共话题的缺陷,提出一种部分比较性跨文本集LDA模型(partial comparative cross collections LDA model,PCCLDA)来实现跨文本集的话题分析,该模型通过层次狄利克雷过程(hierarchical Dirichlet processes,HDP)把话题划分为公共话题和文本集特有话题,使模型能更加精确地对文本进行建模.模型采用Gibbs抽样方法进行参数推导,一系列包括Held-Out数据对数似然和模型困惑度指标在内的定量与定性的实验表明,模型不仅能够发现公共话题在不同文本集中的差异,而且能分析各文本集特有的话题;在Held-Out对数似然测度和模型困惑度指标上,PCCLDA相对当前两个主要的CTM模型具有较大的优势.
- 谭文堂王桢文殷风景葛斌肖卫东
- 关键词:GIBBS抽样
- 一种面向涌现的比较性话题模型被引量:2
- 2013年
- 提出一种CDCMLDA生成模型来实现跨文本集的话题分析,采用狄利克雷组合多项式模型(Dirichlet Compound Multinomial,DCM)对文本集中词的涌现现象进行建模,把DCM模型和LDA结合起来分析文本集之间话题的差异,采用蒙特卡罗期望最大化方法进行参数推导。在多个实际数据集中通过定性和定量的方法对模型进行评价,实验表明,模型不仅能够发现不同文本集间的异同,而且在模型困惑度指标上相对当前两种主要跨文本集的话题模型具有明显的优势。
- 谭文堂王桢文殷风景葛斌肖卫东
- 对等网环境下访问控制技术研究
- 对等网(Peer-to-Peer,P2P)环境具有无中心控制、节点高度自治性和动态性的特点。传统的访问控制是基于用户身份进行授权,难以适应P2P环境。所以需要有针对性地研究P2P环境中的访问控制技术。 本文首先介绍了访问...
- 王桢文
- 关键词:对等网访问控制
- 基于概率生成模型的社区发现和网络数据分类方法研究
- 客观世界中的许多系统都由一些相互联系的实体所组成。而网络提供了一种抽象的形式来描述这类系统。随着信息技术的发展,人们有更强的能力去观察客观世界并且将观察结果记录为数据。于是,各种各样的网络数据大量涌现,如万维网、在线社会...
- 王桢文
- 关键词:数据挖掘
- P2P中基于信任和属性的访问控制被引量:4
- 2011年
- P2P具有无集中控制节点、节点对等自治和网络动态的特点,这些特点为实施访问控制带来很大的挑战,传统的访问控制技术不能很好地适应对等网环境。首先对现有的对等网环境中的访问控制技术进行研究,然后在基于信任模型的角色访问控制的基础上,针对无法区分通过信任模型计算出相同结果的用户的问题,提出了基于信任和属性的访问控制。基于信任和属性的访问控制引入资源属性和用户属性来分别描述资源和用户,依据用户属性、信任模型计算出的数值、环境属性和授权策略来建立用户角色指派关系,依据资源属性和授权策略来建立角色权限指派关系,从而解决基于信任模型的角色访问控制存在的问题。
- 封孝生王桢文黎湘运
- 关键词:访问控制P2P
- 一种面向多文本集的部分比较性LDA模型
- 跨时空、跨文化文本挖掘等比较性文本挖掘(comparative text mining,CTM)旨在从多个可比的文本集中发现各文本集隐含语义结构的异同.针对当前主要的CTM模型只能分析公共话题的缺陷,提出一种部分比较性跨...
- 谭文堂王桢文殷风景葛斌肖卫东
- 关键词:信息处理
- 文献传递
- 一种面向多文本集的部分比较性混合模型被引量:2
- 2013年
- 针对当前主要的CTM模型只能分析公共话题的缺陷,提出一种PCCMix混合模型来实现跨文本集的话题分析.该模型把多个文本集中的话题划分为公共话题和文本集特有话题,首先根据文本数据建立这两类话题在所有词上的概率分布,再使用期望最大化算法进行模型的参数估计.实验结果表明,该模型不仅能够发现公共话题在不同文本集中的差异,而且能分析各文本集特有的话题.模型能更精确地对文本建模,具有良好的性能.
- 谭文堂王桢文殷风景葛斌肖卫东
- 关键词:概率分布混合模型