国家重点基础研究发展计划(2009CB326203)
- 作品数:12 被引量:74H指数:4
- 相关作者:胡学钢王浩张玉红姚宏亮吴共庆更多>>
- 相关机构:合肥工业大学皖西学院合肥师范学院更多>>
- 发文基金:国家重点基础研究发展计划国家自然科学基金安徽省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于熵理论的匿名发布表质量度量方法研究
- 2011年
- 匿名发布表质量度量问题是微观数据发布匿名模型中的重要内容之一。已有相关研究工作主要从准码属性取值层次变化幅度或泛化等价组中元组记录数角度定义匿名发布表质量度量方法,具有度量结果不精确的缺点。基于信息熵理论,根据泛化前后等价组中准码属性在不同层次取值包含的精确信息量变化情况,结合考虑具体数据分析任务对准码属性敏感程度不同因素为不同准码属性泛化路径设置权重,设计一组细粒度的匿名发布表隐私保护程度和信息损失程度度量方法。实验分析表明,利用该方法能够更加精确地度量泛化匿名表质量。
- 徐勇丁忠明王浩黄灿
- 关键词:隐私保护信息损失K-匿名数据发布
- 基于Factored Frontier算法的动态贝叶斯网络灵敏性分析方法被引量:2
- 2012年
- 贝叶斯网络的灵敏性分析是研究模型局部参数或证据微小变化对于目标结点所产生的影响,以发现复杂系统的重要参数和结构.然而对于动态贝叶斯网络,当前还没有一种有效的灵敏性分析算法.针对隐马尔科夫模型(HMM)灵敏性分方法不能用于分析动态贝叶斯网络灵敏性和灵敏性分析计算复杂性高的问题,提出一种可有效处理动态贝叶斯网络灵敏性分析算法(SA_FF).SA_FF算法利用FF近似推理算法(Factored Frontier)思想求解动态贝叶斯网络的灵敏性函数,通过对马尔可夫毯所构成边界(Frontier)的动态推理建立参数与目标结点条件概率分布之间的函数关系;SA_FF算法在灵敏性函数推理计算过程中,通过对局部性边界的边缘化进行信息传播,不需要对模型的联合概率分布进行更新,显著提高了计算的效率,且可用于多参数灵敏性分析,但会引入一定的误差;进而,通过误差分析证明所引入的误差是有界的.最后,通过实例计算的比较和分析显示SA_FF算法的有效性.
- 姚宏亮袁正王浩
- 关键词:动态贝叶斯网络灵敏性分析
- 基于Mashup数据聚合的Web购物服务系统
- 网上购物越来越受欢迎,商店在互联网上注册量也出现前所未有的增长。由于信息和服务分散在不同的网站,导致网上购物消耗人们较多的时间。针对该问题,本文研究了一种基于MVC模型的互联网聚合平台,并使用ExtJS中的特定组件聚合W...
- 王婧吴共庆章湘南胡学钢
- 关键词:MASHUP数据聚合MVC模型
- 文献传递
- 基于Web的频繁分子结构挖掘系统
- 将频繁子图挖掘算法应用到化学分子的频繁子结构挖掘中,对于化合物的合成以及新药发现等研究都有极大的推动作用。本文利用Java开源软件开发工具包ParMol(Parallel Molecular Mining)和Marvin...
- 徐仁干吴共庆李海光胡学钢吴信东
- 文献传递
- 基于C4.5和NB混合模型的数据流分类算法被引量:9
- 2010年
- 具有概念漂移的含噪数据流的分类问题成为数据流挖掘领域研究的热点之一。提出了一种基于C4.5和Nave Bayes混合模型的数据流分类算法CDSMM。它以C4.5作为基分类器,采用朴素贝叶斯分类器过滤噪音,同时引入假设检验中的μ检验方法检测概念漂移,动态更新模型。实验结果表明,CDSMM算法在处理带有噪音的概念漂移数据流时具有比同类算法更好的分类正确率。
- 李燕张玉红胡学钢
- 关键词:数据流概念漂移
- 基于小样本学习的垃圾邮件过滤方法被引量:2
- 2010年
- 针对客户端垃圾邮件过滤器难以获取足够训练样本的问题,提出一种基于小样本学习的垃圾邮件过滤方法,利用容易获取的未标记样本提高垃圾邮件过滤的性能。该方法使用已标记的小样本邮件实例集训练一个初始Na?veBayes分类器,以此标注未标记邮件,再使用所有数据训练新的分类器,利用EM算法进行迭代直至收敛。实验结果证明,当给定5个~20个已标记小样本训练邮件时,该方法可有效提高垃圾邮件过滤性能。
- 潘洁珠周晓吴共庆胡学钢
- 关键词:EM算法垃圾邮件过滤
- 一种基于最大熵模型的加权归纳迁移学习方法被引量:4
- 2011年
- 传统机器学习和数据挖掘算法主要基于两个假设:训练数据集和测试数据集具有相同的特征空间和数据分布.然而在实际应用中,这两个假设却难以成立,从而导致传统的算法不再适用.迁移学习作为一种新的学习框架能有效地解决该问题.着眼于迁移学习的一个重要分支——归纳迁移学习,提出了一种基于最大熵模型的加权归纳迁移学习算法WTLME.该算法通过将已训练好的原始领域模型参数迁移到目标领域,并对目标领域实例权重进行调整,从而获得了精度较高的目标领域模型.实验结果表明了该算法的有效性.
- 梅灿华张玉红胡学钢李培培
- 关键词:数据挖掘最大熵归纳式ADABOOST
- 典型相关分析与多伯努利相关模型的图像标注被引量:1
- 2010年
- 文章提出一种基于图像的视觉词袋与文本标注的典型相关分析与分割无关的多伯努利相关模型的自动图像标注算法。在图像标注与分类任务中,矢量量化图像局部描述子得到的视觉词袋特征已显示了其鲁棒性与可区分性,文中对视觉词袋与文本特征作典型相关分析,确保投影变换后新的视觉特征与文本特征的相关性最大化,从而有效地在视觉与文本2种模态中建立联系,契合了自动图像标注的主旨。文中还提出了一种简化的多伯努利相关模型,实验结果证明了典型相关分析比概率潜藏语义分析更适合于图像自动标注,也证明了简化的多伯努利相关模型的有效性。
- 周晓潘洁珠
- 关键词:自动图像标注尺度不变特征变换
- 一种基于证据理论和模糊距离的融合方法
- 2011年
- 针对决策支持系统中专家不确定性意见难以融合的问题。本文提出了一种基于证据理论和模糊距离相结合的决策融合方法。首先运用模糊距离方法来获得专家的权重和属性指标的相对权重,并对专家决策中由于主观认识的局限性带来的不确定性问题进行了研究。然后运用DS证据理论识别框架计算出概率分配函数,并对所有方案进行排序选择,得出最终的决策融合意见。最后,通过实验表明,运用此方法对不确定性信息的融合具有很好的可行性和有效性。
- 田卫东张建良
- 关键词:证据理论
- 功能树的EFVM求解算法被引量:6
- 2010年
- 为了解决与或非功能树求解中经常出现的方案数量巨大的问题,提出一种基于四值矩阵(FVM)的功能树求解算法.从与或非功能树的特点出发构造了四值矩阵、扩展四值矩阵(EFVM)和FVM系统;分析了FVM系统与经典命题逻辑中范式系统的同构关系及FVM的扩展与展开,给出EFVM直接求解算法;在考虑约简的基础上,提出EFVM约简求解算法.实例结果说明:EFVM约简求解算法在冗余较多的情况下可有效降低解的规模,有力地推动了产品概念设计.
- 唐益明刘晓平
- 关键词:概念设计代数系统