陈淑珍
- 作品数:6 被引量:7H指数:2
- 供职机构:三明学院计算机科学系更多>>
- 发文基金:福建省自然科学基金山东省自然科学基金更多>>
- 相关领域:理学自动化与计算机技术更多>>
- 粗糙集理论在Web文本挖掘特征提取中的应用被引量:2
- 2004年
- 特征提取是文本挖掘基础性、关键性的技术,现将基于粗糙集的属性约简算法应用于文本挖掘中特征项的提取工作,以解决文本特征降维问题.实验表明,利用粗糙集方法进行特征提取,能够去掉多余属性,大大降低文本特征项的维数.
- 陈淑珍卢昌荆林克明
- 关键词:特征提取粗糙集WEB文本挖掘
- S-粗集与新金属材料发现(Ⅰ)被引量:1
- 2005年
- 给出遗传知识,S-粗集的遗传概念;提出S-粗集的F-遗传定理,-F-遗传定理,(F,-F)-遗传定理;讨论了(F,-F)-遗传与F-遗传的关系,(F,-F)-遗传与-F-遗传的关系.利用这些结果,本文给出属性值遗传的概念,提出属性值遗传链定理和属性遗传定理,这些结果是研究金属遗传特性的重要理论准备,这些结果在讨论金属遗传特性(本文第Ⅱ部分)中得到了应用.S-粗集的遗传特性与金属的遗传特性之间潜藏着密切的联系.
- 史开泉颜建军陈淑珍
- 关键词:S-粗集属性值
- S-粗集与新金属材料发现(Ⅱ)
- 2005年
- 给出属性下界值,属性上界值的数据生成概念,给出属性下界值的数据生成模型,属性上界值的数据生成模型;提出金属材料的遗传-进化定理,金属材料的遗传进化-遗传变异原理.利用这些数据模型讨论了发现新金属材料的方法;对于新发现的新金属材料用例子证明它的存在,本文的例子说明,S-粗集和它的属性值模型是材料科学中新材料发现的一个新的工具.
- 史开泉陈淑珍
- 关键词:S-粗集
- WEB文本挖掘的中文分词系统的设计与实现被引量:2
- 2005年
- 设计了一个基于W eb文本挖掘的分词系统。具体介绍了如何将H tm l格式的文档转化为Txt格式文本,以及利用M M法来实现对文档的汉语自动分词。并采用最大匹配加回退一字方法,处理交段长度为1的交集型歧义字段。
- 陈淑珍卢昌荆林克明
- 关键词:文本挖掘中文自动分词消歧
- 变异粗集与它的过滤特性被引量:1
- 2006年
- 利用变异粗集的概念,提出了变异粗集粒度、过滤度的概念,讨论了变异粗集(X-(α),X-(α))与Z.Pawlak粗集(R-(X),R-(X))的粒度、过滤度的关系特征,给出了变异粗集粒度、过滤度的单调性定理.本文的讨论是对变异粗集理论的丰富与发展.
- 刘纪芹陈淑珍王红雨
- 一种适用于中小数据集的关联规则挖掘算法被引量:1
- 2006年
- 探讨了Apriori算法的改进问题,提出了一种适用于中小数据集的关联规则挖掘算法。该算法主要特点是简单、清晰、高效。一方面充分使用了内存的高效存贮,另一方面使用了位运算快速进行计数,同时简化了Apriori算法中频繁项集的计算,大大的减少了中间变量及其存贮的时间和空间,提高了关联规则挖掘的速度和效率。
- 林克明陈淑珍
- 关键词:数据挖掘关联规则APFIORI算法频繁项集