搜索到295篇“ 潜在语义索引“的相关文章
- 基于潜在语义索引的作文跑题检测评分系统及方法
- 本发明涉及自然语言处理技术领域,具体为基于潜在语义索引的作文跑题检测评分系统及方法,数据收集和预处理模块用于收集作文和其对应的题目,并对采集的文章进行预处理;术语矩阵模块用于建立术语‑文档矩阵,对结果进行归一化;潜在语义...
- 何经武曾凡
- 基于潜在语义索引的上网行为分析方法、系统和介质
- 本发明提供一种基于潜在语义索引的上网行为分析方法、系统和介质。所述方法包括:步骤S1、基于用户历史上网日志来确定所述用户的上网行为的潜在语义特征矩阵;步骤S2、利用所述潜在语义特征矩阵来计算所述用户的上网行为的行为链;以...
- 张强喻波王志海魏力谢福进
- 基于潜在语义索引的上网行为分析方法、系统和介质
- 本发明提供一种基于潜在语义索引的上网行为分析方法、系统和介质。所述方法包括:步骤S1、基于用户历史上网日志来确定所述用户的上网行为的潜在语义特征矩阵;步骤S2、利用所述潜在语义特征矩阵来计算所述用户的上网行为的行为链;以...
- 张强喻波王志海魏力谢福进
- 基于潜在语义索引的Wikidata机构实体聚类研究被引量:2
- 2019年
- 【目的】Wikidata机构类目范畴树中,存在实例数目过多而使类目的外延过大、不能明确指示及类分资源的问题。为系统化机构名称层级体系,需将这些实例进行划分,使其均衡分布在机构范畴树的各层。【方法】将无监督的层次聚类算法用于解决无类别标签的机构实例的自动聚簇问题。为消除机构实体名称中特征词共现对聚类算法的影响,引入Wikidata中机构实体的相关属性作为其上下文环境。同时聚类算法对数据的维度十分敏感,因此采用潜在语义索引作为文本表示模型,通过奇异值分解将高维数据映射到潜在的低维语义空间。【结果】本文方法在实验数据集上的聚类准确率达到87.3%,取得了较好的聚类效果。【局限】仅在小样本数据集上进行验证。【结论】为机构名称提供上下文环境有利于同类机构的聚集,基于潜在语义索引模型的层次聚类算法对于高维度的文本聚类问题是有效的。
- 贾君枝叶壮壮
- 关键词:潜在语义索引层次聚类
- 基于潜在语义索引的职位描述聚类研究被引量:1
- 2017年
- 本研究鉴于某公司职位描述存在的特点以及其所带来的问题,对其展开研究。由于职位描述中的文本字数少、数量多,特征维数较高,样本特征稀疏,不能很好的抽取出文本关键特征。针对这些问题,我们用潜在语义索引模型(LSI)对文本进行特征提取,分析潜在语文空间维度对聚类性能的影响,然后根据提取的特征进行K-means聚类,能有效降低简历匹配筛选过程中的职位类别数,提高了简历匹配的效率。
- 黄鑫溢周维民
- 关键词:潜在语义索引K-MEANS职位描述
- 基于潜在语义索引的科技文献主题挖掘被引量:4
- 2014年
- 提出了一种基于潜在语义的科技文献主题挖掘方法,描述了科技文献的主题挖掘模型。对科技文献集进行预处理,计算特征词权重,构造出词汇-文献矩阵。用改进的LSI算法对稀疏矩阵进行降维得到固定的主题-文献矩阵。取权重最高的主题作为该文献的主题。该方法利用Frobenius范数来规范矩阵,对稀疏矩阵进行降维,可以快速精确地挖掘出科技文献的主题。
- 刘勘朱芳芳
- 关键词:潜在语义索引主题挖掘
- 一种改进的基于潜在语义索引的文本聚类算法被引量:3
- 2014年
- 提出一种改进的基于潜在语义索引的文本聚类算法。算法引入潜在语义索引理论,改进传统的SOM算法。用潜在语义索引理论表示文本特征向量,挖掘文本中词与词之间隐藏的语义结构关系,从而消除词语之间的相关性,实现特征向量的降维。改进传统的SOM算法的局限性,准确给出聚类类别数目的值。实验结果表明,本算法的聚类效果更好,聚类时间更少。
- 侯泽民巨筱
- 关键词:文本聚类潜在语义索引自组织映射
- 基于潜在语义索引的Web文本挖掘
- 当今社会已跨入互联网时代,人们生活也因它而改变,互联网已然成为人们学习、工作和休闲的好帮手。然而,随之带来的负面影响却是人们对繁多杂乱的信息不知所措。因此,如何有效的挖掘浩瀚的文本信息中自己想要的内容,是研究人员面临的一...
- 吴志媛
- 关键词:WEB文本聚类大众分类法
- 基于潜在语义索引的LYNC即时消息过滤研究
- Lync Server2010是微软最新一代整合通讯产品,即为大家所熟知的OfficeCommunications Server2007 R2的下一版本。在即时通信提供信息传输便利的同时,一些不法分子也趁机利用这些工具来...
- 何靖侃
- 关键词:潜在语义索引支持向量机
- 一种基于潜在语义索引的谱聚类方法研究被引量:2
- 2011年
- 传统的文本聚类算法存在文本向量维度过高,算法易陷入局部最优问题。针对上述问题,提出了一种适用于文本的基于潜在语义索引的谱聚类方法,该方法应用了潜在语义索引和谱聚类方法的优点,不仅分析了词与词之间的语义关系,而且适用于任意形状分布的样本数据聚类。针对航空安全报告的聚类实验表明,该方法取得了较好的聚类效果。
- 冯霞闫冠男李娟娟
- 关键词:文本聚类潜在语义索引奇异值分解谱聚类
相关作者
- 林鸿飞

- 作品数:462被引量:3,009H指数:27
- 供职机构:大连理工大学
- 研究主题:生物医学 关系抽取 情感分析 文本 语言模型
- 宋宜斌

- 作品数:63被引量:166H指数:7
- 供职机构:烟台大学文经学院
- 研究主题:RBF神经网络 潜在语义索引 神经网络 复杂系统 非线性系统
- 王立宏

- 作品数:56被引量:154H指数:7
- 供职机构:烟台大学计算机与控制工程学院
- 研究主题:半监督聚类 潜在语义索引 数据挖掘 决策表 启动子
- 秦洋

- 作品数:8被引量:5H指数:1
- 供职机构:烟台大学计算机学院
- 研究主题:潜在语义索引 启动子 DNA序列 启动子识别 语义差异
- 曾雪强

- 作品数:42被引量:122H指数:6
- 供职机构:江西师范大学
- 研究主题:文本分类 情感 偏最小二乘 潜在语义索引 文本分类模型