林莉媛
- 作品数:9 被引量:32H指数:3
- 供职机构:福州大学数学与计算机科学学院更多>>
- 发文基金:国家自然科学基金模式识别国家重点实验室开放课题基金福建省自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 一种情感词典构建方法及系统
- 本发明涉及自然语言处理领域,公开了一种情感词典构建方法及系统。本方案公开的情感词典构建方法及系统,基于同义词词林,通过对同义词词林的检索,只需预先设定的少量种子词,就能获取大量情感词,从而获得扩展的种子词词集,并根据评价...
- 李寿山林莉媛周国栋
- 文献传递
- 融入距离信息的最小二乘回归子空间分割被引量:4
- 2016年
- 有效分类基因表达数据有助于癌症的诊断,而基因表达数据的高维数、小样本特点使基因表达数据分类困难。针对这个问题,在最小二乘回归子空间分割算法中考虑距离信息,提出融入距离信息的最小二乘回归子空间分割算法。融入距离信息的最小二乘回归子空间分割模型除了考虑数据之间的相关性,还考虑了数据之间的距离信息。在基因表达数据集上的实验结果表明,所提出的算法是有效的聚类方法。
- 林莉媛陈晓云简彩仁
- 关键词:基因表达数据聚类
- 基于有监督学习方法的多文档文本情感摘要被引量:3
- 2014年
- 该文研究有监督学习方法在多文档文本情感摘要中的应用。利用从亚马逊中文网和亚马逊英文网上收集的产品评论语料,抽取文本内特征、PageRank特征、情感特征和评论质量特征,基于有监督方法进行多文档文本情感摘要抽取。实验结果表明有监督学习方法比无监督学习方法在ROUGE值上有显著的提高,情感特征和评论质量特征均有助于文本情感摘要。
- 李艳翠林莉媛周国栋
- 关键词:情感特征有监督学习最大熵分类器
- 基于光滑近邻表示的基因表达数据子空间聚类被引量:2
- 2017年
- 基因表达数据具有样本数少、基因维数高、非线性等特点,为能有效地处理基因表达数据,提出光滑近邻表示子空间聚类算法.利用每个数据点的近邻线性表示刻画数据集的非线性特点,并对近邻表示添加光滑约束,使数据点与近邻的距离关系嵌入到该数据点的重构表示中.在基因表达数据上的实验表明,所提出的方法优于其他几个现有方法,进而表明所提出方法对基因表达数据的聚类是有效的.
- 陈晓云林莉媛叶先宝
- 关键词:基因表达数据子空间聚类
- 基于PageRank的中文多文档文本情感摘要被引量:19
- 2014年
- 文本情感摘要任务旨在对带有情感的文本数据进行浓缩、提炼进而产生文本所表达的关于情感意见的摘要。该文主要研究基于多文档的文本情感摘要问题,重点针对网络上存在同一个产品的多个评论产生相应的摘要。首先,为了进行关于文本情感摘要的研究,该文收集并标注了一个基于产品评论的中文多文档文本情感摘要语料库。其次,该文提出了一种基于情感信息的PageRank算法框架用于实现多文档文本情感摘要,该算法同时考虑了情感和主题相关两方面的信息。实验结果表明,该文采用的方法和已有的方法相比在ROUGE值上有显著提高。
- 林莉媛王中卿李寿山周国栋
- 关键词:情感多文档
- 基于评论质量的多文档文本情感摘要被引量:2
- 2015年
- 任务旨在对带有情感的文本数据进行浓缩、提炼进而产生文本所表达的关于情感意见的摘要,用以帮助用户更好地阅读、理解情感文本的内容。该文主要研究多文档的文本情感摘要问题,重点针对网络上存在的同一个产品的多个评论进行摘要抽取。在情感文本中,情感相关性是一个重要的特点,该文将充分考虑情感信息对文本情感摘要的重要影响。同时,对于评论语料,质量高的评论或者说可信度高的评论可以帮助用户更好的了解评论中所评价的对象。因此,该文将充分考虑评论质量对文本情感摘要的影响。并且为了进行关于文本情感摘要的研究,该文收集并标注了一个基于产品评论的英文多文档文本情感摘要语料库。实验证明,情感信息和评论质量能够帮助多文档文本情感摘要,提高摘要效果。
- 林莉媛王中卿李寿山周国栋
- 关键词:多文档
- 文本情感摘要方法研究
- 文本情感分析任务旨在对带有情感描述的文本数据进行浓缩、提炼进而产生文本所表达的关于情感意见的分析,用以帮助用户更好的阅读、理解情感文本的内容。 本研究主要内容包括:⑴收集并标注了基于产品评论的中文和英文多文档文本情感语...
- 林莉媛
- 关键词:信息检索数据挖掘情感分析程序语言
- 文献传递
- 一种情感词典构建方法及系统
- 本发明涉及自然语言处理领域,公开了一种情感词典构建方法及系统。本方案公开的情感词典构建方法及系统,基于同义词词林,通过对同义词词林的检索,只需预先设定的少量种子词,就能获取大量情感词,从而获得扩展的种子词词集,并根据评价...
- 李寿山林莉媛周国栋
- 基因表达数据的低秩投影最小二乘回归子空间分割被引量:3
- 2017年
- 基因表达数据具有高维、小样本、多噪声和高冗余的特点,使传统聚类方法效率较低.子空间分割是高维数据聚类的有效手段,但直接对基因表达数据进行子空间分割会降低聚类性能.为了更有效地聚类,文中提出低秩投影最小二乘回归子空间分割方法.首先利用改进的低秩方法将数据投影至潜在子空间,以便去除数据中可能的毁损,得到较干净的数据字典.然后采用最小二乘回归方法获得数据低维表示并构造仿射矩阵,利用该仿射矩阵实现聚类.在6个公开基因表达数据集上的实验表明文中方法的有效性.
- 陈晓云肖秉森林莉媛
- 关键词:基因表达数据聚类