湛燕
- 作品数:20 被引量:206H指数:6
- 供职机构:河北大学更多>>
- 发文基金:河北省自然科学基金河北省教育厅科研基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术理学更多>>
- 基于遗传算法学习聚类算法的中心个数被引量:10
- 2003年
- 无导师聚类算法的目标是将一个数据集划分为若干个类,使得类内相似性尽可能大且类间相似性尽可能小。聚类过程中对数据集合分割成多少个类是一个很难确定的问题,目前还没有较好的解决方法。文章使用遗传算法对无导师聚类K-均值(K-means)算法中中心个数K值进行学习,实现了使用遗传算法进行聚类中心个数的确定,旨在提供一种选择中心参数个数的方法。通过对UCI机器学习数据库中的7个数据库进行实验,证实此方法是比较有效的。
- 湛燕杨芳王熙照
- 关键词:遗传算法
- 真实书写环境下脱机手写汉字识别
- 杨芳司建辉张春琴张充湛燕徐东
- 课题对环形笔画的处理进行研究,提出了双角度监测宏观拐点的提取方法,增强了对汉字书写的适应性。基于统计特征描述方法原理,采用了双层动态网格笔画位置关系描述方法描述汉字笔画的结构特征,简化了结构特征的表示方法。以基本笔画为特...
- 关键词:
- 关键词:汉字识别分类器
- 基于主题本体扩展特征的短文本分类被引量:4
- 2014年
- 短文本具有不同于普通文本的独有特点,例如文本长度较短,特征选择分散不一,这使得短文本文类需要处理这些特殊的问题.本文使用了基于主题本体的特征扩展方法,考虑了特征之间的语义关联,达到了较好的分类性能.同时,通过GC(扩展能力)算法使用了案例维护学习,在K-近邻算法中减少样例个数,从而可以提高搜索近邻样例的效率.数值型实验证明了这种学习算法的有效性.
- 湛燕陈昊
- 电力智能服务系统的设计与实现被引量:3
- 2010年
- 电力智能服务系统(PISS)是一个集成了管理信息系统(MIS)技术、地理信息系统(GIS)技术以及人工智能技术的电力综合业务处理与智能决策系统.借助嵌入式GIS组件,实现了基于配电网拓扑结构的业务管理.通过对空间数据和业务数据的智能分析,借助知识库和模型库,应用启发式搜索等智能算法实现了业扩报装工程中布线设计方案的决策支持.采用决策树技术实现了业务领域知识的自主学习.实际应用表明,系统能够为供电企业提供较为完整的综合业务解决方案,决策处理过程和结果是合理有效的.
- 陈昊湛燕张素芳
- 关键词:地理信息系统决策支持系统决策树系统集成
- 基于小波变换与软计算技术的人脸识别研究
- 翟俊海王熙照赵素云湛燕何玉林孟庆武王华超白晨燕董令彩
- 课题对“基于小波变换与软计算技术的人脸识别研究”进行了全面研究,重点研究了小波变换和代数方法及投影子空间技术相结合的人脸图像特征提取方法;基于软计算技术的特征选择和分类器设计。提出了基于小波多尺度奇异值分解的人脸识别方法...
- 关键词:
- 关键词:人脸识别方法
- Lazy和Eager分类算法的比较研究被引量:1
- 2004年
- 数据挖掘的两个高层目标是预测和描述,这个过程中分类算法的应用是非常广泛的。分类算法在机器学习领域中可以分为Lazy和Eager两种类型,分别具有不同的算法特点。文章基于实验对这两种类型的分类算法进行了分析,概括出适宜两种类型的环境条件,旨在提出实际应用中进行算法选择的经验性结论。
- 陈昊王熙照袁方湛燕
- 关键词:数据挖掘K-近邻决策树
- Web用户访问模式挖掘被引量:13
- 2002年
- 随着网站内容的不断丰富和访问量的增加 ,网站结构变得越来越复杂 ,导致信息获取和推送都比较困难 .将数据挖掘技术应用于用户访问模式 ,形成了Web访问模式挖掘 .Web访问模式挖掘是从Web访问日志中挖掘有用的用户访问信息 ,据此可以形成关联规则、序列模式、聚类模式和分类模式等 4类信息 ,这对于优化站点结构、为不同类别的用户提供个性化服务 ,有效地实现信息获取和信息推送是非常必要的 .Web访问模式挖掘是目前数据挖掘领域的一个重要研究课题 ,结合研究工作 ,从概念、方法、任务、过程、应用及面临的挑战等方面对其进行了较详细的评述 .
- 王熙照王丽娟袁方湛燕
- 关键词:数据挖掘WEB日志WEB访问模式挖掘数据源数据预处理
- 使用遗传算法实现K-means聚类算法的K值选择被引量:29
- 2003年
- 针对无导师聚类K 均值算法中K值的选取问题 ,提出了使用遗传算法 (缩写为GA)优化K值参数的方法。通过对UCI机器学习数据库中 7类数据的实验 ,表明本方法是比较有效的。
- 杨芳湛燕田学东郭宝兰
- 关键词:遗传算法K-MEANS聚类算法数据库
- K-近邻、K-均值及其在文本分类中的应用
- K-均值(K-means)算法聚类的结果依赖于距离度量的选取。传统的K-均值算法选择的相似性度量通常是欧几里德距离的倒数,这种距离通常涉及所有的特征。在距离公式中引入一些特征权参数后,其聚类结果将依赖于这些权值,从而可以...
- 湛燕
- 关键词:文本分类K-均值算法遗传算法中文分词
- 文献传递
- 学习特征权值对K-均值聚类算法的优化被引量:73
- 2003年
- K 均值 (K means)算法聚类的结果依赖于距离度量的选取 传统的K 均值算法选择的相似性度量通常是欧几里德距离的倒数 ,这种距离通常涉及所有的特征 在距离公式中引入一些特征权参数后 ,其聚类结果将依赖于这些权值 ,从而可以通过调整这些权值优化聚类效果 由于K 均值算法是迭代算法 ,很难直接确定其权值以优化聚类结果 ,因此提出了一种间接的学习权值算法以改进聚类结果 从数学意义上讲 ,这种权值学习相当于欧氏空间中对一组点进行了一个线性变换
- 王熙照王亚东湛燕袁方
- 关键词:K-均值聚类相似度量特征权值