江苏省科技攻关计划(BE2006357) 作品数:19 被引量:90 H指数:6 相关作者: 周海岩 金春霞 严云洋 郭志波 杨静宇 更多>> 相关机构: 淮阴工学院 南京理工大学 太原师范学院 更多>> 发文基金: 江苏省科技攻关计划 江苏省高校自然科学研究项目 国家自然科学基金 更多>> 相关领域: 自动化与计算机技术 电子电信 文化科学 自然科学总论 更多>>
位置加权文本聚类算法 被引量:6 2011年 文本聚类是自然语言处理研究中一项重要研究课题,文本聚类技术广泛地应用于信息检索、Web挖掘和数字图书馆等领域。本文针对特征词在文档中的不同位置对文档的贡献大小不同,提出了基于特征词的位置加权文本聚类改进算法——TCABPW。通过选取反映文档主题的前L个高权值的特征项构造新的文本特征向量,采用层次聚类和K-means文本聚类相结合的改进算法实现文本聚类。实验结果表明,提出的改进算法在不影响聚类质量的情况下大大地降低了文本聚类的维度,在稳定性和纯度上都有显著提高,获得了较好的聚类效果。 金春霞 周海岩关键词:文本聚类 文本向量 位置加权 概念向量文本聚类算法 被引量:11 2011年 为了解决基于传统关键词的文本聚类算法没有考虑特征关键词之间的相关性,而导致文本向量概念表达不够准确,提出基于概念向量的文本聚类算法TCBCV(Text Clustering Based on Concept Vector),采用HowNet的概念属性,并利用语义场密度和义原在概念树的权值选取合适的义原作为关键词的概念,实现关键词到概念的映射,不仅增加了文本之间的语义关系,而且降低了向量维度,将其应用于文本聚类,能够提高文本聚类效果。实验结果表明,该算法在文本聚类的准确率和召回率上都得到了较大的提高。 白秋产 金春霞 周海岩关键词:知网 文本聚类 基于DP标准发射端扩频时钟发生器电路设计 2009年 在优化各模块电路性能及相关参数,综合考虑电路功耗、性能等方面因素的基础上,设计符合DisplayPort接口标准的发射端扩频时钟发生器。通过整体的电路级仿真验证,表明该设计达到了降低电磁干扰的目的。 刘金岭关键词:扩频 时钟发生器 电路设计 建立频繁项目集向量的极大频繁项目集挖掘 2009年 在分析和研究诸多经典关联规则挖掘算法或最大频繁项目集挖掘算法的基础上,提出了一种新的极大频繁项目集挖掘算法BOFPV_MMFIA算法。该算法引入频繁项目集向量FP-V,将极大频繁项目集的挖掘过程转化为频繁项目集向量FP-V的与运算过程。算法只需扫描数据库一次,克服了Apriori及其相关算法产生大量候选集和需多次扫描数据库的缺点。又不同于BOM算法,挖掘频繁k_项目集时,需要进行km次k个向量的与运算。因此,BOFPV_MMFIA算法的效率明显高于Apriori、DMFIA及BOM算法。 周海岩关键词:数据挖掘 关联规则 城建档案图文综合管理的设计与实现 2007年 介绍了适合中小城市城建档案馆现代化管理需要,实现档案数据、文字及图纸一体化管理的"城建档案图文综合管理系统"的设计思想、开发过程和所使用的主要技术。 严云洋 丁瑾关键词:城建档案 图文 一体化 动态向量的中文短文本聚类 被引量:10 2011年 因中文短文本特征词词频低、存在大量变形词和新词的特点,使得中文短文本相似度发生漂移,难以直接使用现有的面向长文本的聚类算法。针对短文本相似度漂移问题,提出了一种基于《知网》扩充相关词集构建动态文本向量的方法,利用动态向量计算中文短文本的内容相似度,进而发现短文本之间的内在关联,从而缓解特征词词频过低和存在变形词以及新词对聚类的影响,获得较好的聚类结果。实验结果表明,该算法的聚类质量高于传统算法。 金春霞 周海岩关键词:文本相似度 文本聚类 K-MEANS算法 基于RB_Tree的证书吊销系统 2009年 提出了公钥基础设施(Public Key Infrastructure,PKI)中证书吊销问题的一种解决方案——RB_搜索树解决方案(Certificate Revocation RB-Tree,CRRBT).该方案在查询与更新时最大时间复杂度始终保持在O(log2n)量级,对工程实现具有一定的指导意义. 周海岩关键词:公钥基础设施 证书吊销 单像素宽度目标轮廓提取的实现 被引量:6 2007年 在人脸检测、火灾识别等应用中,应用物体的轮廓特征来检测和定位目标物体是一种有效的方法。本文提出一种基于连通区域面积阈值化的实现算法,可以同时实现噪声消除与轮廓提取,并据此定位图像中的物体目标。实验结果显示,只要噪声面积没有超过物体面积,应用该算法即可实现噪声完全消除,并能够得到连续的无交叉的单像素宽度的物体轮廓,且轮廓不变形。 严云洋 盛明超 杨静宇关键词:边缘检测 噪声消除 目标检测 基于AVL搜索树的证书吊销系统 被引量:1 2009年 针对公钥基础设施中的证书吊销问题,提出一种基于AVL搜索树的解决方案,该方案在查询与更新时的最大时间复杂度始终保持在O(lbn)量级。实验结果表明,该方案是有效的,且对工程实现具有一定指导意义。 周海岩 赵建洋关键词:公钥基础设施 证书吊销 二叉搜索树 基于双阈值的增强型AdaBoost快速算法 被引量:17 2007年 在应用AdaBoost算法的人脸检测中,针对训练时间太长及权重调整过适应等问题,提出一种基于特征值等分和双阈值的增强型AdaBoost快速训练算法,给出了双阈值的快速搜索方法。在MIT-CBCL人脸和非人脸训练库上对算法进行了实现。实验结果显示,改进后的双阈值增强型AdaBoost算法简化了训练过程,训练速度提高50倍,收敛速度也更快。使用训练得到的检测器对MIT+CMU人脸测试库进行了测试,结果表明,该方法在检测精度和速度等方面都优于单阈值方法。 严云洋 郭志波 杨静宇关键词:双阈值 人脸检测